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PREFACIO 

À TERCEIRA EDIÇÃO 

Este livro teve como origem o texto de um curso de Álgebra Linear, 
oferecido para alunos de Engenharia, Física, Matemática, Estatística e Computação 
da Universidade Estadual de Campinas. O programa foi estabelecido tendo em vista 
que seria o único curso de Álgebra Linear que a maioria dos alunos receberia. 

Por isso, procuramos englobar os assuntos que seriam indispensáveis aos cursos que 
estes alunos seguissem posteriormente. Ele foi ministrado numa disciplina de 
segundo semestre que é seqüência de um cureo, também semestral, de Geometria 
Analítica. 

Os pré-requisitos para a leitura deste texto são os tópicos de Matemática, 
normalmente vistos até o curso Colegial. A partir destes, introduzimos e 
desenvolvemos razoavelmente os conceitos básicos de Álgebra Linear, procurando 
sempre indicar aos alunos as fontes às quais eles podem recorrer para aprofundar 
seus conhecimentos. 

Alunos que cursam pela primeira vez esta disciplina, freqüentemente 
julgam-na muito abstrata e não vêem como podem utilizar os conceitos básicos. 

E, normalmente, muitos cursos terminam sem que se mostre aos alunos uma 
aplicação concreta de tudo o que aprenderam. 

Procuramos, então, dar aos tópicos uma abordagem com dois objetivos: 

1. Conseguir uma exposição da matéria, de tal forma que a ênfase seja 
colocada no uso dos conceitos. Neste sentido, optamos por uma exposição em 
que estes sejam introduzidos, na medida do possível, dentro de um contexto 

onde surja a necessidade de sua apresentação. Algumas demonstrações são propostas 
na forma de exercícios, o que permite uma maior fluência do texto e possibilita 
ao aluno desenvolvê-las dentro do seu raciocínio lógico. 

2. Encaminhar os conceitos para a solução de problemas nos quais os alunos 
já tenham sentido dificuldade. Desta forma, é conveniente fixar qualquer um dos 
capítulos (Cap. 11: Classificação de Cônicas e Quádricas; Cap. 12: Resolução de 
Sistemas de Equações Diferenciais; Cap. 13: Processos Iterativos; Cap. 14: Conjuntos 
Convexos e Programação Linear ), como chave, ou seja, um capítulo que englobe 

os diversos conceitos apresentados no livro. Na busca das soluções para os 
problemas que colocamos nestes capítulos recorremos à maioria dos conceitos 
incorporados em um curso tradicional de Álgebra Linear (noções de espaço 
vetorial, autovalores e autovetores, diagonalização de operadores), de modo que 
os alunos possam perceber a inter-relação entre eles e a aplicação conjunta 
dos mesmos. 



Dentro desta perspectiva, poderíamos sugerir algumas seqüências para 
o desenvolvimento de um curso de Álgebra Linear: 

1. Capítulos 1 a 11; 

2. Capítulos 1 a8e 12; 

3. Capítulos 1 a 8 e 13; 

4. Capítulos 1 a 8 e 14. 

Uma outra sugestão é a de que o conteúdo deste livro seja desenvolvido, 
como já vem sendo feito, em disciplinas que integrem os tradicionais cursos de 
Cálculo, Álgebra Linear e Equações Diferenciais. 

Quanto aos aspectos didáticos, gostaríamos de ressaltar que os exercícios 
são importantes inclusive como extensão de cada capítulo* O conteúdo foi 
elaborado de modo a se enquadrar em diversos programas, podendo-se deixar 
de estudar as seções assinaladas com asterisco sem prejuízo do entendimento dos 
tópicos abordados. Por exemplo, seções como Cadeia de Markov (seção 1.5) 
e Ajuste de Curvas (8.8), que são tópicos especiais, podem ou não ser incluídas 
de acordo com o interesse de cada aluno, grupo ou classe. 

Nesta terceira edição, a antiga seção 4.9 foi ampliada e transformada no 
atual Capítulo 14: Conjuntos Convexos e Programação Linear. A relativa 
simplicidade deste assunto e seu grande numero de aplicações práticas são 
responsáveis por sua difusão e interesse nos últimos anos. Anexamos a este novo 
capítulo uma seção de autoria do Prof. Antonio Carlos Moretti, que descreve 
o algoritmo do método simplex para programação linear e indica as etapas para 
a programação por microcomputadores deste método. 

A nossa experiência, assim como a de outros professores, tem mostrado 
que o núcleo de um curso introdutório de Álgebra Linear e, portanto, o deste 
livro, corresponde à matéria exposta nos Capítulos de 1 a 8, podendo ser 
excluídas as seções 7.2 a 7.4, dependendo dos objetivos a atingir. 

Recomendamos especial atenção aos capítulos introdutórios, principalmente 
ao que trata de Sistemas Lineares, e que fornecerão a base técnica indispensável 
para a boa compreensão dos demais capítulos, além de conterem em si métodos 
fundamentais aplicáveis a muitas situações. Acreditamos que as seções e capítulos 
alternativos permitam opções para trabalhar com os conceitos de Álgebra Linear 
em diferentes áreas. 

Queremos agradecer a todas as pessoas que leram e utilizaram o livro, 
enviando sugestões, e de modo especial aos professores Antonio Carlos Gilli Martins 
e João Frederico C. A. Meyer. 


Os Autores 


MATRIZES 


1.1 INTRODUÇÃO 

Nesta seção, apresentamos os conceitos básicos sobre matrizes. Estes conceitos 
aparecem naturalmente na resolução de muitos tipos de problemas e são essen¬ 
ciais, não apenas porque eles ‘‘ordenam e simplificam” o problema, mas tam¬ 
bém porque fornecem novos métodos de resolução. 

Chamamos de matriz uma tabela de elementos dispostos em linhas e co¬ 
lunas. Por exemplo, ao recolhermos os dados referentes a altura, peso e idade 
de um grupo de quatro pessoas, podemos dispô-los na tabela: 



Altura (m) 

Peso (kg) 

Idade (anos) 

Pessoa 1 

1,70 

70 

23 

Pessoa 2 

1,75 

60 

45 

Pessoa 3 

1,60 

52 

25 

Pessoa 4 

1,81 

72 

30 
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Ao abstrairmos os significados das linhas e colunas, temos a matriz: 


1,70 

70 

23 

1,75 

60 

45 

1,60 

52 

25 

1,81 

72 

30 


Observe que em um problema em que o número de variáveis e de observações é 
muito grande, essa disposição ordenada dos dados em forma de matriz torna-se abso- 
lutamente indispensável. 

Outros exemplos de matrizes são: 



[3 0 1 ] [1] 


Os elementos de uma matriz podem ser números (reais ou complexos), funções, 
ou ainda outras matrizes. 

Representaremos uma matriz de m linhas e n colunas por: 

tfn a n ... a ln 

a 2 i 022 a 2n 

x n - ; ; : " x n 

a m\ a m2 a mn 


Usaremos sempre letras maiusculas para denotar matrizes, e quando quisermos 
especificar a ordem de uma matriz A (isto é, o número de linhas e colunas), 
escreveremos A mXn . Também são utilizadas outras notações para matriz, além 
de colchetes, como parênteses ou duas barras. Por exemplo: 



Não obstante, neste livro as matrizes aparecerão sempre entre colchetes. 

Para localizar um elemento de uma matriz, dizemos a linha e a coluna 
(nesta ordem) em que ele está. Por exemplo, na matriz: 



o elemento que está na primeira linha e terceira coluna é -4, isto é, 0 13 = -4, 
Ainda neste exemplo, temos a u - 1, a n = 0, 021 = 4. a 2 2 = -3 e a 23 = 2. 
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1,1.1 Definição: Duas matrizes A mXn = e B rXs = l^i/Vxs são 

iguais, A = B, se elas têm o mesmo número de linhas (m = r) e colunas (n = 
= s), e todos os seus elementos correspondentes são iguais ( 0 ,y = bjj). 

Exempl ° : 1 logll [9 sen 90° o" 

_2 2 2 5 J ~ |_2 4 5 . 


1.2 TIPOS ESPECIAIS DE MATRIZES 

Ao trabalhar com matrizes, observamos que existem algumas que, seja pela 
quantidade de linhas ou colunas, ou ainda, pela natureza de seus elementos, 
têm propriedades que as diferenciam de uma matriz qualquer. Além disso, estes 
tipos de matrizes aparecem freqüentemente na prática e, por isso, recebem no¬ 
mes especiais. 

Consideremos uma matriz com m linhas e n colunas que denotamos por 

xn : 

1.2.1 Matriz Quadrada é aquela cujo número de linhas é igual ao número 
de colunas (m = n). 

Exemplos : 


No caso de matrizes quadradas A mXrrn costumamos dizer que A é uma matriz 
de ordem m. 


1 -2 0 

3 0 1 

4 5 6 


e 18 ] 


1.2.2 Matriz Nula é aquela em que úf,y = 0, para todo i e j. 


Exemplos : 



0 0 0 0 0 

e B 3 xs“ 0 ^ 0 0 0 

0 0 0 0 0 ^ 


1.2.3 Matriz-Coluna é aquela que possui uma única coluna (n = 1). 


Exemplos: 



Analogamente, temos: 
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1.2.9 Matriz Simétrica é aquela onde m = n e ay = <tji- 
Exemplos : 



a b c d 
b e f g 
c f h i 
d g i k 


Observe que, no caso de uma matriz simétrica, a parte superior é uma "refle¬ 
xão” da parte inferior, em relação à diagonal. 


1.3 OPERAÇÕES COM MATRIZES 


Ao utilizar matrizes, surge naturalmente a necessidade de efetuarmos certas ope¬ 
rações. Por exemplo, consideremos as tabelas, que descrevem a produção de grãos 
em dois anos consecutivos. 


Produção de grãos (em milhares de toneladas) durante o primeiro ano 


soja 

feijão 

arroz 

milho 

Região A 

3000 

200 

400 

600 

Região B 

700 

350 

700 

100 

Região C 

1000 

100 

! 

500 

800 



Se quisermos montai uma tabela que dê a produção por produto e por região 
nos dois anos conjuntamente, teremos que somar os elementos corresponden¬ 
tes das duas tabelas anteriores: 
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3000 200 400 600 5000 50 200 oi 8000 250 600 600 

700 350 700 100 + 2000 100 300 300 = 2700 450 1000 400 

1000 100 500 800J [,2000 100 600 600 J L 3000 200 1100 1400 - 

Ou seja: 


Produção de grãos (em milhares de toneladas) durante os dois anos 


soja 

feijão 

arroz 

milho 

Região A 

8000 

250 

600 

600 

Região B 

2700 

450 

1000 

400 

Região C 

3000 

200 

1100 

1400 


Podemos considerar agora a seguinte situação. Existem muitos incentivos 
para se incrementar a produção, condições climáticas favoráveis etc M de tal 
forma que a previsão para a safra do terceiro ano será o triplo da produção do 
primeiro. Assim, a matriz de estimativa de produção deste último será: 







soja 

feijão 

arroz 

milho 



3000 

200 

400 

600 


9000 

600 

1200 

1800 

Região A 

700 

350 

700 

100 

= 

2100 

1050 

2100 

300 

Região 

B 

_1000 

100 

500 

800_ 


_3000 

300 

1500 

2400 _ 

Região 

C 


Acabamos de efetuar, neste exemplo, duas operações com matrizes: soma e 
multiplicação por um número, que serão definidas formalmente, a seguir. 

1.3.1 Adição: A soma de duas matrizes de mesma ordem, A m xn = 

= [aij] e B m x n = [fy/L ® uma matriz m x n, que denotaremos A + B, cujos 
elementos são somas dos elementos correspondentes de A e B. Isto é, 

A + B = [dij + bjj] m xn 

Exemplo: 



Observe que, pela forma com que foi definida, a adição de matrizes tem as 
mesmas propriedades que a adição de números reais. 
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Propriedades: Dadas as matrizes A, B e C de mesma ordem mxn , temos: 

0 À + B = B + A (comutatividade) 
ii) A + (B + C) = (A + B) + C (associatividade) 

Hi) A + 0 = A, onde 0 denota a matriz nula m x n. 

Poderá ser usada a notação 0 m x n P ara a matriz nula, quando houver perigo de 
confusão com o número zero. 

A operação que definiremos a seguir é a multiplicação de uma matriz 
por um número (real ou complexo), também chamada multiplicação por esca¬ 
lar. 

1.3.2 Multiplicação por Escalar: Seja A = [dij] m x n e ^ um número, então 
definimos uma nova matriz 

k * A = [kdij] m xn 

Exemplo : 



Propriedades: Dadas matrizes A e B de mesma ordem m x n e números k , k v e 
& 2 > temos: 

0 k (A + B) = kA + *B 
«) (*i + A 2 )A = AjA + A 2 A 

iii) 0 • A = 0, isto é, se multiplicarmos o número zero por qualquer matriz 
A .teremos a matriz nula. 
ív) ki (k 2 A) = (kik 2 )A 

Às vezes, é conveniente considerarmos as linhas de uma dada matriz como 
colunas de uma nova matriz. 

1.3.3 Transposição: Dada uma matriz A = podemos obter uma 

outra matriz A' = [£,/],,cujas linhas são as colunas de A, isto é, hy = 

A 1 é denominada transposta de A. 

1.3.4 Exemplos 

Exemplo 1: 
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Exemplo 2: 

B * [3 2 ] B ' ■ [3 2 ] 

Exemplo 3 : 

'2] - P 

Propriedades: 

/) Uma matriz é simétrica se, e somente se ela é igual à sua transposta, isto 
é, se, e somente se A = A*. (Observe a matriz B acima.) 
ü) A” = A. Isto é, a transposta da transposta de uma matriz é ela mesma. 
Ui) (A + B/ = A' + B'. Em palavras, a transposta de uma soma é igual à so¬ 
ma das transpostas. 

iv) (kA)' = kA\ onde k é qualquer escalar. 

Antes de definir uma outra operação, a multiplicação de matrizes, veja¬ 
mos um exemplo do que pode ocorrer na prática. 

Suponhamos que a seguinte matriz, forneça as quantidades das vitaminas 
A, B e C obtidas em cada unidade dos alimentos 1 e II. 

ABC 

Alimento I 4 3 0~l 
Alimento II _5 0 1J 

Se ingerirmos 5 unidades do alimento I e 2 unidades do alimento II, quanto 
consumiremos de cada tipo de vitamina? 

Podemos representar o consumo dos alimentos I e II (nesta ordem) pela 
matriz "consumo”: 

[5 2] 

A operação que vai nos fornecer a quantidade ingerida de cada vitamina é 0 
"produto”: 

O 15 21 B l ?] 

= 15 * 4 + 2 * 5 5*3 + 2*0 5 * 0+ 2 * 1 ] 

= [30 15 2] 

Isto é, serão ingeridas 30 unidades de vitamina A, 15 de B e 2 de C. 
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Outro problema que poderemos considerar em relação aos dados anteriores é 
o seguinte: 

Se o custo dos alimentos depender somente do seu contéudo vitamínico e 
soubermos que os preços por unidade de vitamina A, B e C são, respectivamente, 
1 , 5 , 3 e 5 u.c.p., quanto pagaríamos pela porção de alimentos indicada anterior¬ 
mente? 

1,5 

(**) [30 15 2] • 3 

1_5 


= [30(1,5) + 15(3) +2(5)] 

-[ 100 ] 


Ou seja, pagaríamos 100 u.c.p. 


Observamos que nos “produtos” de matrizes efetuados em (*) e ( ), cada 

um dos elementos da matriz-resultado é obtido a partir de uma linha da primeira 
matriz e uma coluna da segunda. Além disso, com relação às ordens das matrizes en¬ 
volvidas, temos: 

Em (*) L li x 2 • l kx3 = I I 1 X 3 
Em (**) [ lixa • t laxi = [ lixi 

O exemplo anterior esboça uma definição de multiplicação de matrizes A e B, 
quando A é uma matriz linha. Esta noção de produto pode ser estendida para o 
caso mais geral, e os elementos da matriz-produto serão obtidos pela soma de produ¬ 
tos dos elementos de uma linha da primeira matriz pelos elementos de uma coluna 
da segunda matriz. Por exemplo, 

Sejam 


_ #n #12 #13 

#21 #22 #23 


A matriz -produto AB é a matriz 2X2 definida como. 


i- n ^11 ^12 

= r u an ai3 ■ b 2i b 22 

[_a 2i a 22 o 23 J ^ 

[ a n b n + #12^21 + #13^31 

# 21^11 + # 22^21 + # 23^31 


# 11^12 + # 12^22 + # 13^32 
#21 ^12 + #22 ^22 + # 23^32 


Agora, passemos para a definição geral. 
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1.3.5 Multiplicação de Matrizes: Sejam A = [a,y] m Xn e B = \b rs \ n yp- 
Definimos AB = [c uv ] m x p 

onde 

n 

^uv - ^ a uk^kv - a uibiv + + a un^nv 

k= 1 

Observações : 

/) Só podemos efetuar o produto de duas matrizes A mXn e B/xp se 0 n ú- 
mero de colunas da primeira for igual ao número de linhas da segunda, 
isto é, n = l. Além disso, a matriz-resultado C = AB será de ordem 
m x p. 

xi) O elemento c,y (í-ésima linha e y-ésima coluna da matriz-produto) é obti¬ 
do, multipÜcando os elementos da í-ésima linha da primeira matriz pelos 
elementos correspondentes da y-ésima coluna da segunda matriz, e soman¬ 
do estes produtos. 

1.3.6 Exemplos 

Exemplo 1 : 



2 • 1 + 1 • 0 2(-I) +1-4 

4*1 + 2*0 4(-l) + 2*4 

5 • 1 + 3 * 0 5(-l) + 3 • 4 J 3 X 2 



Exemplo 2: 



Não é possível efetuar esta multiplicação, porque o número de colunas da primeira 
é diferente do número de linhas da segunda. 

Exemplo 3: 
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Propriedades: 

j) Em geral AB =£ BA (podendo mesmo um dos membros estar definido e o 
outro não). 

Exemplo : 

** 1-1 ii r 1 2 3 

Sejam A = -3 2 -1 e B = 2 4 6 

|_-2 1 oj L 1 2 3 _ 

"0 0 ol [-11 6 -1 

Então AB = 0 0 0 e BA - -22 12 -2 

0 0 OJ [-11 6 -1_ 

Note, ainda, que AB = 0, sem que A = 0 ou B = 0. 

Desde que sejam possíveis as operações, as seguintes propriedades são válidas: 

U) AI = IA = A (Isto justifica 0 nome da matriz identidade.) 
iii) A(B + C) « AB + AC (dístributividade à esquerda da multiplicação, em re¬ 
lação à soma) 

ív) (A + B)C = AC + BC (dístributividade à direita da multiplicação, em 
relação à soma) 

v) (AB)C = A(BC) (associatividade) 
ví) (AB)' = B'A' (Observe a ordem!) 
víí) 0 • A = 0 e A • 0 = 0 

1.4 EXERCÍCIOS 

1. Sejam 


n 2 ji-fl 

0 

;1 

c = 

-1 

2 

|_2 1 -lj’ [_ 3 

0 

u 


4 


Encontre: 

a) A + B 

b) A • C 

c) B • C 

d) C D 

e) D • A 

f) D • B 

g) -A 

h) -D 
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2. Seja A 


T 2 *0 

|_ 2 x - 1 0 J 


Se A' = A, então x = 


3. Se A é uma matriz simétrica, então A - A’ =__—- 

4. Se A é uma matriz triangular superior, então A' é-. 

5. Se A é uma matriz diagonal, então A' =-• 

6 . Verdadeiro ou falso? 

a) (-A)' = -(A') 

b) (A + B)' = B' + A' 

c) Se AB = 0, então A = 0 ou B = 0. 

d) (ki A) (*,B) = (M 2 )AB 

e) (- A) (-B) = - (AB) 

f) Se A e B são matrizes simétricas, então AB = BA. 

g) Se A • B = 0, então B • A = 0. 

h) Se podemos efetuar o produto A ♦ A, então A é uma matriz quadrada. 


7. Se A 2 = A • A, então 


r-2 íi 2 

L 3 2j = 


8 . Se A é uma matriz triangular superior, então A 2 é 
9 Ache x, y, z, w se [3 4 ] = [q Í] 


10 . Dadas A 


1 -3 2 


4 -3 -1 


mostre que AB = AC. 


14 10 


1 -3 , B = 2 1 1 1 eC= 3 -2 -1 -1 


1-212 


2 1 -1 


2-5-1 0 


11. Suponha que A # 0 e AB = AC onde A, B, C são matrizes tais que a multiplica¬ 
ção esteja definida. 

a) B = C? 

b) Se existir uma matriz Y, tal que YA = I, onde I é a matriz identidade, então 
B = C? 

12. Explique por que, em geral, (A + B) 2 # A 2 + 2 AB + B 2 e (A + B) (A - B) ¥= 
A 2 -B 2 . 


2 -3 -5 


1 -3 -4 


13. Dadas A=-l 4 5 , B = 1-3-5 eC=-l 3 4 


-13 5 


2 -2 -4 


1 -2 -3 
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a) Mostre que AB - BA = 0, AC = Ae CA = C 

b) Use os resultados de (a) para mostrar que ACB = CBA, A 2 - B 2 = 
= (A - B) (A t B) e (A + B ) 2 = A 2 + B 2 . 

14. Se A = ^ "jJ, ache B, de modo que B 2 = A. 

15. Um construtor tem contratos para construir 3 estilos de casa: moderno, medi¬ 
terrâneo e colonial. A quantidade de material empregada em cada tipo de casa é 
dada pela matriz: 


Ferro 

Madeira 

Vidro 

Tinta 

Tijolo 

Moderno 5 

20 

16 

7 

17 

Mediterrâneo 7 

18 

12 

9 

21 

Colonial 6 

25 

8 

5 

13 


(Qualquer semelhança dos números com a realidade é mera coincidência.) 

a) Se ele vai construir 5,7 e 12 casas dos tipos moderno, mediterrâneo e colonial, 
respectivamente, quantas unidades de cada material serão empregadas? 

b) Suponha agora que os preços por unidade de ferro, madeira, vidro, tinta e ti¬ 
jolo sejam, respectivamente, 15, 8 , 5, 1 e 10 u.c.p. Qual é o preço unitário 

de cada tipo de casa? 

c) Qual o custo total dò material empregado? 

16. Uma rede de comunicação tem cinco locais com transmissores de potências 
distintas. Estabelecemos que ay = 1, na matriz abaixo, significa que a 
estação / pode transmitir diretamente à estação /, a,y = 0 significa que a 
transmissão da estação i não alcança a estação /! Observe que a diagonal 
principal é nula significando que uma estação não transmite diretamente 

para si mesma. To 1 1 1 l” 

10 110 
A = 0 1 0 1 0 

0 0 10 1 

_0 0 0 1 0 _ 

Qual seria o significado da matriz A 2 = A • A? 

5 

Seja A 2 = [c/y]. Calculemos o elemento c 42 = ^ atküki - 0 + 0 + 1 +0+0=1. 

* = i 

Note que a única parcela não nula veio de a A2 • = 1-1. Isto significa 

que a estação 4 transmite para a estação 2 através de uma retransmissão 
pela estação 3, embora não exista uma transmissão direta de 4 para 2. 
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a) Calcule A 2 . 

b) Qual o significado de c 13 = 2? 

c) Discuta o significado dos termos nulos, iguais a 1 e maiores que 1 de 
modo a justificar a afirmação: “A matriz A 2 representa o número de 
caminhos disponíveis para se ir de uma estação a outra com uma única 
retransmissão”. 

d) Qual o significado das matrizes A + A 2 , A 3 e A + A 2 + A 3 ? 

e) Se A fosse simétrica, o que significaria? 


17. Existem três marcas de automóveis disponíveis no mercado: o Jacaré, o 
Piranha e o Urubu. 0 termo da matriz A abaixo é a probabilidade de 
que um dono de carro da linha i mude para o carro da coluna /, quando 
comprar um carro novo. 



Para 


J 

P 

U 

0,7 

0,2 

0,1 

0,3 

0,5 

0,2 

0,4 

0,4 

0,2 


Os termos da diagonal dão a probabilidade a# de se comprar um carro 
novo da mesma marca. 

A 2 representa as probabilidades de se mudar de uma marca para outra 
depois de duas compras. Você pode verificar isto a partir dos conceitos básicos 
de probabilidade (consulte 1.5) e produto de matrizes. 

Calcule A 2 e interprete. 


18. Tente descobrir outras situações concretas que possam ser analisadas de 
modo similar ao de cada um dos problemas 15, 16 e 17. 


* 1.5 PROCESSOS ALEATÓRIOS: CADEIAS DE MARKOV 

Muitos dos processos que ocorrem na natureza e na sociedade podem ser estu¬ 
dados (pelo menos em primeira aproximação) como se o fenômeno estudado 
passasse, a partir de um estado inicial, por uma seqüência de estados, onde a 
transição de um determinado estado para o seguinte ocorreria segundo uma 
certa probabilidade. (Suporemos nesta secção um conhecimento mínimo sobre 
probabilidades.) No caso em que esta probabilidade de transição depende ape¬ 
nas do estado em que o fenômeno se encontra e do estado a seguir, o proces¬ 
so será chamado processo de Markov e uma seqüência de estados seguindo 
este processo será denominada uma cadeia de Markov. Evidentemente, ao se 
supor tal restrição estaremos simplificando, talvez demasiadamente, uma vez 


que as probabilidades podem se modificar com o tempo. Mas, assim mesmo, a 
informação que obtivermos com este modelo já nos servirá de auxílio para 
uma previsão do comportamento de certos fenômenos. 

Suponhamos, por exemplo, que, em uma determinada região, observa-se 
que se chover bastante durante um ano, a probabilidade de que chova bastante 

1 3 

no ano seguinte é — , e que a probabilidade de que faça seca é de — . Ainda, 

se houver seca em um ano, no ano seguinte a probabilidade de haver seca ou 

chuva suficiente será a mesma, e igual a y . Suponhamos também, para simplificar 

(o que não ocorre na prática, embora possamos usar como recurso para ter um 
indicador da situação), que estas probabilidades não mudem com o decorrer do 
tempo. Os estados possíveis para este processo são: chuva e seca. 

Podemos ter, então, as seguintes seqüências de acontecimentos (árvore de 
probabilidades): 

Assim, sabendo que no primeiro ano houve seca, a probabilidade de que 

chova bastante no terceiro ano éy*y+y-y=y. Conforme o número de 

anos aumenta, as contas se tornam mais complicadas e, se estivermos interessa¬ 
dos em previsões a longo prazo sobre o clima da região, temos que procurar 
um outro procedimento. Isto pode ser feito se introduzirmos a noção de matriz 
das probabilidades de transição , e a de vetor de probabilidades. A matriz T das 
probabilidades de transição é obtida da tabela de probabilidades onde o elemen¬ 
to na /-ésima linha e /-ésima coluna indica a probabilidade de transição do /-ési- 
mo para o í-ésimo estado. 

19 ano 29 ano 39 ano... 
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0 vetor de probabilidades é a matriz 



cuja primeira linha dá a probabilidade de que haja chuva no n-ésimo ano e a segunda 
linha dá a probabilidade de que haja seca no n-ésimo ano. 

Analisando a árvore de probabilidades vemos que 



7 P (l) 
4 



P 


(O 

s 





P 


, 0 ) 

s 


Observamos que T * 



j_ J_ 
4 2 

3 1 


4 2 




(D 

s 




(0 

$ 


e portanto 



0 mesmo ocorre do segundo para o terceiro ano, deste para o quarto etc. Temos, 
então, a seqüência: 

l?ano 2? ano 3? ano 
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Portanto, o comportamento do clima desta região a longo prazo (isto é, quando n 
aumenta) poderá ser previsto se soubermos que os elementos das matrizes T", 
n = 1 , 2, ... se aproximam dos elementos de uma matriz fixa P pois, neste caso, 

pfP -► Pi e p^ n) -► p 2 quando n - ► 



(Tal previsão é importante, pois se chegarmos, por exemplo, à conclusão que 
-► 1 quando n oo, a longo prazo a região se tomará um deserto.) 

Se T” não se aproxima de uma matriz P, então não poderemos fazer ne¬ 
nhuma previsão a longo prazo, pois o processo se modificará bastante a cada 
passo. Assim, um dos problemas que devemos resolver é quais são as condições 
sobre a matriz T das probabilidades de transição, para que suas potências se 
aproximem de uma determinada matriz. Antes de resolver isto, porém, vamos 
formalizar a situação anterior. 

1.5.1 Definição: Um processo aleatório de Markov é um processo que po¬ 
de assumir estados a lf a 2 , a r> de tal modo que a probabilidade de transição 
de um estado aj para um estado a f * seja p f y (um número que só depende de aj 
e ai). 

A matriz das probabilidades de transição (matriz estocástica) é dada por: 


Pn 

P -12 

• ■ P\T 

Pu 

P22 . 

• • Pir 

Pn 

Pn ■ 

Pn 


(Observe que p# > 0, e que a soma de cada coluna deve ser 1.) 

0 vetor de probabilidades é aquele cuja i-ésima linha dá a probabilidade 
de ocorrência do estado a,- apôs n transações: 
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Seguindo o raciocínio do exemplo anterior vemos que, após n passos, 


T" . 


1.5.2 Previsões a Longo Prazo: Para podermos fazer previsões a longo 
prazo, a matriz T deve cumprir certas condições. Assim, introduzimos a definição 
a seguir. 

1.5.3 Definição: Uma matriz das probabilidades de transição é regular se 
alguma de suas potências tem todos os elementos não nulos. 

A importância da matriz regular para as previsões a longo prazo é dada 
pelo teorema abaixo: 

1.5.4 Teorema: Se a matriz T r x r das probabilidades de transição 6 regular, 
então: 

/) As potências T” aproximam-se de uma matriz P, no sentido de que cada 

elemento de T” aproxima-se do elemento correspondente em P. 

//) Todas as colunas de P são iguais, sendo dadas por um vetor-coluna 



com Pi > 0 , Pi > 0 , ..., p r > 0 . 
rir) Para qualquer vetor de probabilidades inicial 

Pi 0 ' 

V, = : 

UH 

o vetor de probabilidades T n V, aproxima-se de V (dado no item anterior). 
iv) O vetor V é o único vetor que satisfaz V = TV. 
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O que este teorema nos diz é que se a matriz das probabilidades de tran¬ 
sição é regular, então é possível fazer previsão a longo prazo e esta não depen¬ 
de das probabilidades iniciais V t . Além disso, o item (iv) nos indicará como 
achar as probabilidades depois de um longo prazo. O processo utilizado para se 
encontrar o vetor “final” de probabilidades, usando o item (ív), corresponde à 
procura de autovetor associado ao autovalor um da matriz T, segundo as deno¬ 
minações que veremos no Capítulo 6 . Não faremos a prova deste teorema por¬ 
que isto nos desviará demais de nossos objetivos. 


1.5.5 Exemplos 

Exemplo 1: No problema sobre previsão de clima que estávamos estudan¬ 
do na introdução, 



é regular pois sua primeira potência, isto é, ela mesma, já tem todos os elemen¬ 
tos estritamente positivos, e assim podemos concluir, usando o item (íV), que 
quaisquer que sejam as probabilidades iniciais, as probabilidades a longo prazo 
são dadas por: 



f Pc ~ 4 Pc + 2 Ps 

| 3 1 

LPs = 4 Pc + 2 Ps 


OU 


r 2 p s = 3 p c 

[2 p s = 3 p c 



3 

Como devemos ter p c + p s = 1 (que é a probabilidade total), temos p c + ^Pc - 
= 1 ou p c = 4 e > po r t ant °. Ps = T • Assim ’ a lon 8 0 P raz0 a probabilidade de 

, 3 

um ano de chuva é ~ , enquanto que a probabilidade de um ano de seca e j 
(dentro das hipóteses simplificadoras), e portanto a região tenderá a uma ligeira 
aridez. 



20 ÁLGEBRA LINEAR 


Exemplo 2: Suponhamos que em uma determinada região, a cada ano 
três por cento da população rural migra para as cidades, enquanto que apenas 
um por cento da população urbana migra para o meio rural. Se todas as de¬ 
mais condições permanecerem estáveis, as condições políticas não mudarem, e 
estas porcentagens de migração continuarem as mesmas, qual deve ser a relação 
entre as populações urbana e rural desta região a longo prazo? 

Como três por cento da população rural migra para o meio urbano, a 
probabilidade de migração do meio rural para o meio urbano é 0,03, enquanto 
que a probabilidade de não migração é 0,97. Como um por cento da população 
urbana migra para o meio rural a probabilidade de migração do meio urbano 
para o rural é 0,01 e a de não migração é 0,99. Denotando por U o meio ur¬ 
bano e por R o meio rural, temos a matriz das probabilidades de transição: 



R 

u 

R 

0,97 

0,01 

U 

0,03 

0,99 


Como a matriz é regular, a longo prazo as probabilidades p R , de viver no meio 
rural, e py, de viver no meio urbano, devem satisfazer 

0,97 0,01 p R p R 

0,03 0,99 py py 

donde p v = 3 p R e, como devemos ter p v + p R = 1, temos p R = 0,25 e 
Py = 0,75. Ou seja, a longo prazo, e se não houver modificações nas tendênci¬ 
as de migração, teremos 25% da população no meio rural e 75% da população 
no meio urbano. 

Exemplo 3: Observa-se experimentalmente que, em condições naturais e 
sem ser submetida à pesca industrial, a quantidade de uma certa espécie de 
peixes varia da seguinte forma: se em um determinado ano a população dimi¬ 
nuiu, a probabilidade de que diminua ainda mais no ano seguinte é de 0,6 e, 
se em um determinado ano a população aumenta, a probabilidade de que dimi¬ 
nua no ano seguinte é de apenas 0,3. Entretanto, observa-se que sendo subme¬ 
tida à pesca industrial, quando a população aumenta num determinado ano, a 
probabilidade de que diminua no ano seguinte se altera para 0,5, enquanto que 
se a população diminui num ano, a probabilidade de que diminua no ano se- 
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guinte continua sendo de 0,6. Deseja-se saber como, a longo prazo, a pesca in¬ 
dustrial estará afetando os peixes dessa espécie, para ver se é necessário diminuir 
a intensidade de pesca ou se, ao contrário, é possível aumentá-la. 

Os estados deste processo são: diminuição da população (D) e aumento 
da população (A). Então, sem haver pesca industrial, a matriz de probabilidades 
de transição é 



D 

A 

D 

0,6 

0,3 

A 

0,4 

0,7 


Como é uma matriz regular, as probabilidades p D da população diminuir e p A 
da população aumentar a longo prazo são dadas por 


'0,6 

0,3' 

. [ P D 

_ ~PD 

.0,4 

0,1 _ 

.Pa. 

.Pa. 


que, sendo resolvida (lembrando que p D + p A =1), fornece p D - j e p A = — 

Portanto, como a probabilidade de a população aumentar é maior, em condi¬ 
ções naturais, a espécie tem a sobrevivência razoavelmente garantida. Com a 
pesca industrial, a matriz se altera para 



D 

A 

D 

0,6 

0,5 

A 

0,4 

0,5 


Como é uma matriz regular, a longo prazo py e p A sao dadas por 


0,6 0,5 

0,4 0,5 


Pd = Pd 
Pa L Pa 


Assim, temos p D = e p A = . Como a probabilidade de a população dimi¬ 

nuir é maior, se a espécie for submetida à pesca industrial, sua sobrevivência 
será ameaçada e, portanto, a pesca deve ser diminuída. 

Exemplo 4: Duas substâncias distintas estão em contato e trocam íons de 
sódio entre si. Sabe-se (por dedução teórica, ou experimentação) que um ion 
de sódio do meio (1) tem probabilidade 0,7 de passar ao meio (2), enquanto 
que um íon de sódio que esteja no meio (2) tem probabilidade 0,1 de passar 
ao meio (1). Colocando-se dois moles de sódio no meio (1), quais serão as con- 



22 ÁLGEBRA LINEAR 


meio (1) meio (2) 



Figura 1.5.2 

centrações de sódio em cada um dos meios, após um longo período de tempo? 

Os estados deste processo são: o íon está no meio (1) e o íon está no 
meio (2). A matriz de probabilidades de transição é: 



meio (1) 

meio (2) 

meio (1) 

0,3 

0,1 

meio (2) 

0,7 

0,9 


Sejam p x e p 2 as probabilidades de estar no meio (1) e (2), respectivamente. 
Então, inicialmente, quando todo o sódio foi colocado no meio (1), P\ = 1 e 
p[ l) = 0. Como a matriz de probabilidades é regular, a longo prazo as proba¬ 
bilidades não dependem das probabilidades iniciais, e devem satisfazer 

[0,3 0,1] [PH [Pi] 

|_0,7 0,9J ’ LpíJ L Pi\ 

Resolvendo (lembrando sempre que p, + p 2 = 1), temos p, =jep 2 = ~ . 
Logo, as concentrações finais em cada meio são y • 2 = 0,25 moles no meio 
(1) e -T • 2 = 1,75 moles no meio (2). 

O 

1.5.6 Previsões em Genética: Com pequenas modificações das idéias usadas 
nos processos de Markov, podemos estudar vários problemas genéticos. Sabemos 
que o tipo mais simples de transmissão de herança genética é efetuado através 
de pares de genes, os quais podem ser ambos dominantes, recessivos, ou um 
dominante e outro recessivo. Chamemos G o gene dominante ego gene reces¬ 
sivo. Um indivíduo será chamado dominante se tiver genes GG, híbrido se tiver 
genes Gg , e recessivo, caso os genes sejam gg. Um indivíduo herda os genes ao 
acaso, um deles de seu pai e o outro de sua mãe. Assim, nos vários tipos de 
cruzamento, temos probabilidades distintas de transmissão de herança genética. 
No caso de cruzamento de indivíduos dominantes teremos somente filhos de 
genótipos dominantes. 
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GG com probabilidade 1 
GG cruzado com GG —-► Gg com probabilidade 0 

com probabilidade 0 

No caso de cruzamento de indivíduos recessivos, teremos: 


gg cruzado com gg 


rGGc om probabilidade 0 
-Gg com probabilidade 0 
gg com probabilidade 1 


No caso do cruzamento de um indivíduo dominante com um recessivo, temos: 

_^ GG com probabilidade 0 

GG cruzado com gg - Gg com probabilidade 1 

gg com probabilidade 0 

No caso do cruzamento de um indivíduo dominante com um híbrido, temos: 


GG cruzado com Gg 


GG com probabilidade 0,5 
Gg com probabilidade 0,5 
gg com probabilidade 0 


No caso recessivo e híbrido, temos: 

GG com probabilidade 0 

gg cruzado com Gg —► Gg com probabilidade 0,5 

gg com probabilidade 0,5 


E finalmente, no caso de dois indivíduos híbridos, temos: 

GG com probabilidade 0,25 

Gg cruzado com Gg -► Gg com probabilidade 0,5 

gg com probabilidade 0,25 


Denotando por d , dominante, r, recessivo e h , híbrido, e os respectivos cruza¬ 
mentos por d X d, d X r etc., colocando as probabilidades em colunas, pode¬ 
mos montar a seguinte matriz T: 



Biblioteca de O 
Ciência 4 Tecnolôq 

UFPel 
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Além disso, numa população numerosa composta por uma porcentagem 
p £0 de indivíduos de características dominantes, de indivíduos híbridos e 

de indivíduos de características recessivas, a probabilidade de cruzamento 
de genes de um indivíduo dominante com outro dominante é • p Se 
quizermos calcular a probabilidade de um cruzamento onde um dos indivíduos 
é dominante e o outro é híbrido, temos que somar p^ * p^ (considerando 
que o primeiro é dominante e o segundo é híbrido) a p^ - Assim, a 
probabilidade é de 2 p^ • Os outros casos seguem o mesmo raciocínio e 
temos então: 


Cruzamento 

Probabilidade 

d X d 

pf-p? 

rXr 

p" • 

d X r 

2P<, 1) -P ( r l) 

d X h 

2 p<t'-PÍ» 

r X h 

2 Pr° • P^° 

h X h 

PÍ l) ' Ph ] 


(Estamos supondo que a característica genética analisada seja tal que não inter¬ 
fira no cruzamento natural.) 

Então, podemos ter as porcentagens de indivíduos dominantes, , de 
indivíduos híbridos, pj) 2) , e de indivíduos recessivos, p*f \ da segunda geração, 
multiplicando as matrizes: 

p { d ] • p ( à ] 

P ( d 2) 1 0 0 0,5 0 0,25 Pr } ‘ Pr ) 

pj- 2 > = 0 0 1 0,5 0,5 0,5 • 2P ^ ’ Pr 

p™ 0 10 0 0,5 0,25 2P ^ ) ' P ^ } 

J L J 1#' • pP 

_ pP • 

Supondo que não haja. novo cruzamento de indivíduos da primeira gera¬ 
ção (o que, em geral, ocorre com populações de insetos etc.), uma vez obtidas 
as porcentagens de indivíduos da segunda geração, podemos obter as porcenta¬ 
gens da terceira geração, multiplicando novamente a matriz T pelos novos da¬ 
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dos, e assim sucessivamente. Dessa forma, obtemos o perfil genético de qualquer 
geração. Evidentemente, os cálculos tornam-se demorados, mas podem ser feitos 
facilmente, se usarmos calculadoras. Este tipo de análise é muito simples (de¬ 
mais talvez), mas é importante em muitos campos, como em Agricultura, para 
se ter uma idéia da propagação da resistência genética a certos tipos de doença, 
da resistência de insetos a tipos de inseticidas etc. 


Exemplo : Aplica-se um certo tipo de inseticida em uma plantação, 
para se combater uma determinada espécie de insetos. Após a aplicação verifi- 
ca-se que, dos poucos insetos sobreviventes, 60% eram resistentes ao inseticida 
e os outros 40% não o eram (e haviam sobrevivido por razões casuais). Sabe-se 
que o ciclo de vida desses insetos é de um ano e que eles se cruzam apenas 
uma vez em cada geração. Além disso, ficou comprovada que a resistência ao 
inseticida é uma característica dominante e que o inseticida não foi aplicado 
novamente. Tendo estes dados em mente, perguntamos qual é a porcentagem 
de insetos resistentes ao inseticida após dois anos? 

Como a resistência é uma característica dominante, os insetos resistentes 


podem ter genótipo GG ou Gg na relação 1 :2, e assim, 20% dos insetos resis¬ 
tentes são dominantes e 40% são híbridos. Temos, portanto, p ^ ) = 0,2, p \^ = 
= 0,4 e pY' = 0,4 e assim, a distribuição da porcentagem dos insetos após um 


ano é dada por 


'*#>1 [l o 

PÍ 2) = 0 0 

.Pr 2) \ L° 1 


0 

0,5 

0 

0,25 

1 

0,5 

0,5 

0,5 

0 

0 

0,5 

0,25 


( 0 , 2 ) • ( 0 , 2 ) 
(0,4) • (0,4) 
2(0,2) • (0,4) 
2(0,2) . (0,4) 
2(0,4) • (0,4) 
(0,4) • (0,4) 


ou seja, = 0,16, = 0,48 e p^ = 0,36. Após mais um ano, a distribui¬ 

ção de insetos será dada por 



(0,16) (0,16) 
(0,36) (0,36) 

2(0,16) (0,36) 

2(0,16) (0,48) 

2(0,36) (0,48) 

(0,48) (0,48) 


ou seja, p = 0,16, pff = 0,48 e p^ = 0,36. Assim, após dois anos, a por¬ 
centagem dos insetos resistentes ao inseticida será p^ + p), i 1 = 0.16 + 0,48 = 
= 0,64, ou seja, 64% da população é resistente. Dessa forma, se for necessária 
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uma nova aplicação de inseticida, não será conveniente aplicar o mesmo tipo, 
pois ele matará no máximo 36% do insetos. 

Observe que a distribuição dos insetos quanto ao genótipo GG, Gg ou gg 
permaneceu a mesma na segunda e terceira gerações. = Ps’ = 0,16 

PÍ 2) = PÍ 3) = 0,48 e p ( r 2) = pí 3) = 0.36.) 

Calcule as probabilidades para a quarta geração de insetos (depois de três 
anos). O resultado que você obteve não é uma casualidade. Existe uma “lei ge¬ 
nética” muito conhecida, que estabelece sob condições ideais que depois da se¬ 
gunda geração, a distribuição entre os genótipos permanece a mesma. Assim, se 
partirmos de uma população onde a formação inicial é dada por freqüências 
p £ l) = u, pjj 0 = v e p ( r l) = tv, temos: 


Genótipo 

Geração inicial 

Gerações seguintes 

GG 

u 

(«+|) 2 

Gg 

V 

2(u +y) (w + -j) 

gg 

w 

Ov+i) 2 


Você pode mostrar esta relação através do produto de matrizes. 

No “modelo genético” considerado neste parágrafo, é assumida uma situa¬ 
ção-padrão: não existe migração, os encontros são ao acaso, não ocorrem muta¬ 
ções nem seleção, os dois sexos aparecem sempre em quantidades iguais. 

Esta relação de estabilidade genética aqui apresentada foi mostrada inde¬ 
pendentemente, pelo matemático G. H. Hardy e o genético W. Weinberg em 
1908. 


*1.6 EXERCÍCIOS 

1. Suponha que um corretor da Bolsa de Valores faça um pedido para comprar 
ações na segunda-feira, como segue: 400 quotas de ação A, 500 quotas da 
ação B e 600 quotas da ação C. As ações A, B e C custam por quota 
Cr$ 500,00, Cr$ 400,00 e Cr$ 250,00, respectivamente. 

a) Encontre o custo total de ações, usando multiplicação de matrizes. 


b) Qual será o ganho ou a perda quando as ações forem vendidas seis meses 
mais tarde se as ações A, B e C custam CrS 600,00, Cr$ 350,00 e 
Cr$ 300,00 por quota, respectivamente? 

2. É observado que as probabilidades de um time de futebol ganhar, perder e 

empatar uma partida depois de conseguir uma vitória são -i- , j e i respec- 

3 3 2 

tivamente; e depois de ser derrotado sao 3 fõ e T ’ res P e€tlvamente ; e 

1 2 2 

depois de empatar são - e-~ , respectivamente. Se o time não melhorar 

nem piorar, conseguirá mais vitórias que derrotas a longo prazo? 


3. Numa pesquisa procura-se estabelecer uma correlação entre os níveis de esco¬ 
laridade de pais e filhos. Estabelecendo as letras P para os que concluíram o 
curso primário, S para o curso secundário e U para o curso universitário, a 
probabilidade de um filho pertencer a um destes grupos, dependendo do gru¬ 
po em que o pai está é dada pela matriz 


P S U 


P 

S 

u 


_ 2 _ 

3 

J_ 

3 

0 


3 

J_ 

3 

1 

3 


0 


3 

2 

3 


Qual é a probabilidade de um neto de um indivíduo que realizou o curso 
secundário ser um universitário? 


4. Numa cidade industrial, os dados sobre a qualidade do ar são classificados 
como satisfatório (S) e insatisfatório (I). Assuma que, se num dia é registrado 

S, a probabilidade de se ter S no dia seguinte é de J- e que, uma vez regis¬ 
trado 1, tem-se y de probabilidade de ocorrer S no dia seguinte. 

a) Qual é a probabilidade do quarto dia ser S, se o primeiro dia é I? 

b) O que se pode dizer a longo prazo sobre a probabilidade de termos dias 
S ou I? 

5. Numa ilha maravilhosa verificou-se que a cor azul ocorre em borboletas de 
genótipo aa, e não ocorre em Aa e AA. Suponha que a proporção de bor¬ 
boletas azuis seja y . Depois de algumas gerações, qual será a porcentagem 
das borboletas não azuis, mas capazes de ter filhotes azuis? 
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1.7 RESPOSTAS 

1.7.1 Respostas de 1.4 
2. x = 1 

4. Triangular inferior 

6. a) V; b) V, c) F; d) V, e) F; /) F; g) F; h) V 
8. Triangular superior 

12. Porque em geral o produto de matrizes não é comutativo. 

15. a) [146 526 260 158 388] 

‘492’ 

b) 528 
.465., 

c) Cr$ 11.736,00 

16. d) 112 3 1 

0 2 2 2 2 

10 2 11 

0 10 2 0 

00101 


17. [0,59 

0,28 

0,13'" 

0,44 

0,39 

0,17 

0,48 

0,36 

0,16 


1.7.2 Respostas do 1.6 


2 As probabilidades de ganhar, perder ou empatar, a longo prazo, sao aproxi¬ 
madamente iguais a 1/3, sendo a probabilidade de ganhar Hgeiramente maior. 

3. A probabilidade é 1/3. 

4. d) 31/125 a . , , . . , . 

b) A longo prazo, a probabilidade de termos dias satisfatórios e 1/4 e de 

temios dias insatisfatórios é 3/4. 

Leituras Sugeridas e Referências 

* Herstein, I. N.; Tópicos de Álgebra; Editora Polígono, Sao Paulo, 1970. 

2 Lipschutz, S.; Álgebra Linear; McGraw-Htll do Brasil Ltda., Rio de Janeiro, 1971. 

3 SMSG; Matemática: Curso Colegial, vol. 3; Yale University Press, New Haven, 1965. 

4 Campbell, H. G.; Linear Álgebra with Applications; Meredith Corporation, New TorK, 

1971. 


r 1 



SISTEMAS DE EQUAÇÕES 
LINEARES 


2.1 INTRODUÇÃO 

Na natureza, as coisas estão sempre mudando, se transformando, e o ser huma¬ 
no, para garantir sua sobrevivência e melhorar sua existência, precisa conhecer 
e dominar estes processos de mudança. Um dos métodos encontrados para se 
descrever estas transformações foi o de procurar nestas o que permanece cons¬ 
tante durante a mudança. Por exemplo, sabemos que o hidrogênio (H 2 ) reage 
com o oxigênio (0 2 ) para produzir água (H 2 0). Mas, quanto de hidrogênio e 
de oxigênio precisamos? Esta é uma mudança que podemos descrever do seguin¬ 
te modo: x moléculas de H 2 reagem com y moléculas de 0 2 produzindo z mo¬ 
léculas de H 2 0, ou esquematicamente: 

xH 2 + y0 2 —* zH 2 0. 

O 4ue permanece constante nessa mudança? Como os átomos não são 
modificados, o número de átomos de cada elemento no inicio da reação deve 
ser igual ao número de átomos desse mesmo elemento, no fim da reação. Assim, 
para o hidrogênio devemos ter 2x = 2 z, e para o oxigênio, 2y = z. Portanto, as 
as nossas incógnitas x> y e z devem satisfazer as equações: 


2x - 2z = 0 
2 y - z = 0 
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Se conseguirmos descobrir quais são os números x, y, z que satisfazem simul¬ 
taneamente estas relações, teremos aprendido um pouco mais sobre como se 
comporta a natureza. 

Este procedimento que consiste em identificarmos o que permanece cons¬ 
tante na mudança, leva a um sistema de equações que precisa ser resolvido e, 
em muitos casos, as equações envolvidas são lineares (como no exemplo ante¬ 
rior da reação de H 2 com 0 2 ). Evidentemente, você já sabe um pouco como 
resolver este tipo de sistema, mas quando o número de equações se torna muito 
grande, ou temos menos equações do que incógnitas (como no caso anterior), 
podem surgir muitas dúvidas, até mesmo sobre a existência ou não de solução 
para o sistema. 

Por outro lado, em sistemas que apresentam mais do que uma solução é 
necessário ter-se uma forma clara de se expressar todas elas. Por exemplo, no 
sistema anterior você pode encontrar duas soluções distintas para (*, y, z) 

(faça isto!), mas só o terá resolvido se conseguir expressar o conjunto de todas 
as soluções. Por isso, nosso objetivo neste capitulo é estudar um método para 
a resolução de sistemas lineares em geral. A técnica que será utilizada pode não 
ser a melhor no caso de sistemas muito simples, mas tem a vantagem de poder 
ser aplicada sempre e ser facilmente mecanizada. É particularmente útil em sis¬ 
temas com grande número de incógnitas onde o uso de calculadoras é inevitá¬ 
vel. Em síntese, este método consiste em substituir o sistema inicial por siste¬ 
mas cada vez mais simples, sempre “equivalentes” ao original. 

Comecemos com o seguinte exemplo. (Para efeito de visualização, coloca¬ 
remos ao lado de cada sistema uma matriz a ele associada.) 


r 

*1 

+ 4*2 

+ 3*3 = 1 

0) 

1 

4 

3 

1 

2*i 

+ 5*2 

+ 4*3 = 4 

(2) 

2 

5 

4 

4 

*1 

- 3*2 

1 

u> 

II 

LO 

(3) 

1 

-3 

-2 

5 


1? Passo : Eliminamos jt] das equações (2) e (3). Para isto, multiplicamos a 
equação ( 1 ) por -2 e somamos a equação obtida com a equação ( 2 ), obtendo 
uma nova equação (2'). Da mesma maneira produziremos a equação (3 r ), obti¬ 
da ao multiplicarmos a equação ( 1 ) por - 1 , somando esta nova equação à equa¬ 
ção (3). Isto resulta no seguinte sistema: 


(II) 


*i + 4*2 + 3*3 * 1 (O 

O*! - 3*2 - 2*3 = 2 (2') 

0*i - 7*2 - 5*3 = 4 (3') 


14 3 1 

0-3-22 
0-7-54 
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29 Passo: Tornamos o coeficiente de x 2 da equação (2') igual a 1 . Para isto, 
multiplicamos a equação ( 2 ') por -1/3. O sistema resultante é: 


*1 + 4*2 + 3*3 

... . , 2 _ 


(III) 0*i + * 2 + "^*3 
.0*! - 7* 2 - 5*3 = 


39 Passo: Eliminamos * 2 das equações (T) e (3”). Para isto, multiplicamos a 
equação (2") por -4 e somamos a esta a equação (l ”) 5 obtendo (l'"). De ma¬ 
neira análoga obtemos (3'"), multiplicando a equação (2") por 7 e somando a 
esta nova equação a equação (3"). 


*1 

+ 0*2 + 

II 

X 

11 

3 

(í"') 

1 

0 

1 

3 

11 

3 

0*! 

+ * 2 + 

2_ x _ 
3 

2 

3 

(2"') 

0 

1 

2 

3 

2 

“ 3 

0*1 

V. 

+ 0*2 - 

7 * 3 = 

2 

“ 3 

(3'”) 

0 

0 

1 

‘ 3 

2 

3^ 


49 Passo: Tornamos o coeficiente de * 3 na equação (3'") igual a 1. Para isto, 
multiplicamos a equação (3'") por -3. Isto resulta no seguinte sistema: 


*1 + 0*2 + T *3 = 


1 o t 


(V) \ 0*i + *2 + y*3 = 4 (2 /V ) 


0 *! + 0*2 + *3 = 2 


o i f 
0 0 1 


59 Passo: Eliminamos *3 das duas primeiras equações do sistpma V. Multiplica¬ 
mos a equação ( 3 *) por - 1/3 e somamos a esta nova equação a equação (l ft ). 
De modo análogo, multiplicamos a equação (3 ÍV ) por -2/3 e a esta nova equa¬ 
ção somamos a equação (2 n ). Sistema resultante: 


[ *1 + 0 * 2 + 0*3 = 3 
(IV) | 0*! + *2 + 0*3 = -2 
0*! + 0* 2 + * 3 = 2 


1 0 0 
0 1 0 
0 0 1 


ou ainda: 


*j = 3 

*2 = -2 
*3=2 


Biblioteca de \ \ 
Ciência & Tecnologia 

UFPel 
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Assim, cada sistema foi obtido a partir do sistema anterior, por “opera¬ 
ções” que preservaram as igualdades. Por isto, cada terna (x u x 2 , * 3 ) que é so¬ 
lução do sistema I, também será solução dos sistemas seguintes. Deste modo, 
uma vez encontradas as soluções do sistema VI, as soluções do sistema I, se 
existirem devem estar entre estas, isto é, toda solução do sistema I também é 
solução do sistema Ví. 

0 ponto fundamental deste procedimento é que as etapas são todas re¬ 
versíveis. Por exemplo, partindo do sistema II podemos obter o sistema I, da 
seguinte maneira: 

(1) - (O 

(2) = 2 . <T) + (2') 

(3) = (l') + (3') 

(Com esta notação estamos querendo indicar que, por exemplo, a segunda linha 
( 2 ) do sistema I é obtida multiplicando-se por dois a primeira linha (f) do sis¬ 
tema II e somando-se a segunda linha (2 # ) do sistema II, isto é, (2) = 2 • 

•a')+(2').) 

De modo análogo, você pode obter o sistema V a partir de VI, IV a par¬ 
tir de V, III a partir de IV e II a partir de III. Usando o mesmo argumento 
anterior, podemos dizer que toda solução de VI também é solução de 1. A par¬ 
tir das duas afirmações destacadas acima concluímos que os sistemas I, II, III, 
IV, V e VI têm as mesmas soluções e, portanto, *1 = 3, x 2 = -2 e x$ = 2, 
que é a solução de VI, é a única solução do sistema inicial I. (Você pode ve¬ 
rificar por substituição direta, que esta é uma solução, mas apenas como ga¬ 
rantia de que não erramos nos cálculos.) 

Podemos afirmar que no exemplo anterior os sistemas I, II, III, IV, V e 
VI são equivalentes segundo a definição dada a seguir. 

Observe que, no exemplo anterior, as únicas operações que efetuamos 
são dos seguintes tipos: 


nosso primeiro passo seria permutar as equações (1) e (2), de modo a obter o 
coeficiente de x x diferente de zero na primeira equação. 

Estas operações num sistema produzem sempre sistemas com mesmo 
conjunto-solução , como vimos no exemplo anterior. Uma demonstração formal 
deste fato, usando matrizes elementares, será vista em 3.8.5. Agora iremos usar 
matrizes para apresentar uma maneira organizada de resolver sistemas de equa¬ 
ções, seguindo a idéia do exemplo anterior. Antes, porém, vamos formalizar 
alguns conceitos. 

2.2 SISTEMAS E MATRIZES 

2.2.1 Conceitos 

Um sistema de equações lineares com m equações e n incógnitas é um conjunto 
de equações do tipo: 

ú ii*i a i2 x 2 a m x n ~ 

a 2\ X \ ■*" a 22 X 2 * + a 2n x n = &2 

(*) \ ; : : : 

a mi x \ a m2 x 2 + + a mn x n = 

s. 

com ay, 1 < i < m, 1 < / < # 1 , números reais (ou complexos). 

Uma solução do sistema (*) é uma n-upla de números (x A , x 2 , *„) 

que satisfaça simultaneamente estas m equações. 

Dois sistemas de equações lineares são equivalentes se, e somente se toda 
solução de qualquer um dos sistemas também é solução do outro. 

2.2.2 Sistemas e Matrizes 


i) Multiplicar uma equação por um número diferente de zero. 

ii ) Adicionar a equação a outra. 

Existe ainda uma outra operação que às vezes precisaremos efetuar neste 
procedimento, e ela também é reversível. 

Ui) Permutar duas equações. 


Podemos escrever 0 sistema (*) numa forma matricial: 


^11 a \2 

a 2\ a 22 

a \n 
a 2 n 


x i 

x 2 


b , 

b 2 

a m\ a m2 

a mn_ 




-1 

.. s 

-0 


ou A • X = B onde 


Por exemplo, no sistema: 



x 2 

+ 3 x 3 = 5 

(1) 

A — 



< X x 

+ 3x 2 

+ x 3 = 2 

(2) 

A — 

• 


2x x 

+ 4*2 

- x 3 = 1 

(3) 


a m\ 

•• a mn 
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é a matriz dos coeficientes, 



a matriz das incógnitas e 



a matriz dos termos independentes. 

Uma outra matriz que podemos associar ao sistema é 



que chamamos matriz ampliada do sistema. Cada linha desta matriz é simples¬ 
mente uma representação abreviada da equação correspondente no sistema. 
Observe que no exemplo dado em 2.1, ao lado de cada sistema, escrevemos sua 
matriz ampliada. Assim, no sistema dado: 

*1 + Ax 7 + 3*3 - 1 
< 2*i + 5*2 + 4*3 = 4 
* 1 - 3*2 - 2*3 = 5 

temos a forma matricial 



Em termos de matrizes ampliadas, na resolução do sistema, partimos de 




Exemplo : L 3 


1 0 
4 -1 

-3 4 


1 0 

4 -1 

-1 4 
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Se A e B são matrizes m X n, dizemos que B é linha equivalente a A, se B 
for obtida de A através de um número finito de operações elementares sobre 
as linhas de A. Notações: A -> B ou A ^ B. 

Por exemplo, 



Já comentamos em 2.1 que as operações com linhas de um sistema pro- 
duzem outro sistema equivalente ao inicial. Em termos de matrizes, podemos 
enunciar este resultado como: 

2.3.1 Teorema: Dois sistemas que possuem matrizes ampliadas equivalentes 
são equivalentes. 

(A demonstração deste teorema, usando-se matrizes elementares, está em 

3.8.5.) M r . 

Como vimos, o processo utilizado para se resolver sistemas por elimina¬ 
ção de incógnitas” corresponde a passar a matriz ampliada do sistema inicial 
para matrizes-linha equivalentes a esta, até que cheguemos a uma matriz conve¬ 
niente que indique a solução do sistema original. Você pode observar em 2.2. 
que a matriz final (associada ao sistema VI) tem uma forma especial. Ela é um 
exemplo do que chamaremos matriz-linha reduzida à forma escada. O método 
que apresentamos aqui consiste em obter por linha-redução estas matrizes, por 
meio das quais chegamos à solução do sistema de uma forma explicita. 

Um outro .método, conhecido como o Método de Gauss, reduz por linha- 
-equivalência a matriz ampliada do sistema a uma matriz “triangular”. (Você te¬ 
rá a oportunidade de resolver sistemas por este método, que é muito usado por 
suas vantagens computacionais, no Exercício 17 de 2.6. Não perca!) 
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2.4 FORMA ESCADA 

2.4.1 Definição: Uma matriz m X n é linha reduzida à forma escada se 

a) O primeiro elemento não nulo de uma linha não nula é 1. 

b ) Cada coluna que contém o primeiro elemento não nulo de alguma linha tem 
todos os seus outros elementos iguais a zero. 

c) Toda linha nula ocorre abaixo de todas as linhas não nulas (isto é, daquelas 
que possuem pelo menos um elemento não nulo). 

d) Se as linhas 1, ..., r são as linhas não nulas, e se o primeiro elemento não 
nulo da linha i ocorre na coluna ku então k x < k 2 < ... < k r . 

Esta última condição impõe a forma escada à matriz: 



Figura 2.4.1 


Isto é, o número de zeros precedendo o primeiro elemento não nulo de 
uma linha aumenta a cada linha, até que sobrem somente linhas nulas, se hou¬ 
ver. 


2.4.2 Exemplos 


Exemplo 1: 


1 0 0 0 

0 1-10 
0 0 1 0 _ 


Não é a forma escada pois a segunda 
condição não é satisfeita. 


Exemplo 2: 


0 2 
1 0 



Não é a forma escada pois não satisfaz a 
primeira e a quarta condições. 


Exemplo 3: 


0 1-3 0 1 

0 0 0 0 0 

0 0 0 -1 2 _ 


Não satisfaz a primeira nem a 
terceira condição. 


Exemplo 4: 


0 1-302 
0 0 0 1 2 

0 0 0 0 0 


É a forma escada pois todas as 
condições são satisfeitas. 
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2.4.3 Teorema: Toda matriz A m x„ é linha equivalente a uma única ma¬ 
triz-linha reduzida à forma escada. 

Para a demonstração, veja a secção 2.7. Este teorema permite-nos definir 
os conceitos abaixo que serão relacionados a seguir com o número real de equa- 
ções e o número de soluções de um sistema. 

2.4.4 Definição: Dada uma matriz A mX „, seja B mXn a matriz-linha re- 
duzida à forma escada linha equivalente a A. O posto de A, denotado por p, é 
o número de linhas não nulas de B. A nulidade de A é o número n - p. 

Observamos que dada uma matriz A qualquer, para achar seu posto neces¬ 
sitamos encontrar primeiro sua matriz-linha reduzida à forma escada, e depois 
contar suas linhas não nulas. Este número é o posto de A. A nulidade é a di¬ 
ferença entre colunas de A e o posto. 

2.4.5 Exemplos 

Exemplo 1: Desejamos encontrai o posto e a nulidade de A, onde 

1 2 10 

A= -1 0 3 5 

1-211 

Assim, efetuamos as seguintes operações com matrizes: 

“ 1 2 1 Oi [~1 2 10 

-1 0 3 5 —*• 0 2 4 5 

1 -2 1 ij L° ' 4 0 l - 




O posto de A é 3 e a nulidade de A é 4 - 3 = 1. 

Observação: Se interpretarmos a matriz A dada acima como sendo a matriz 
ampliada de um sistema linear, teremos: 
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tem o mesmo posto e nulidade que B. 

Reinterpretando as matrizes acima como sistemas de equações, diremos 
que o sistema de quatro equações associado à matriz inicial: 

2x - y - 3 
x + 4y - 2 
' * - 5y = l 
4.x + I6y = 8 

é equivalente ao sistema de duas equações: 

f n 14 
x + 0y = y 

1 „ 1 

0x + y = j 

i 

associado à matriz-linha reduzida à forma escada. Este é um caso de sistema 
com equações redundantes. A terceira e a quarta equações (que se tornam nu¬ 
las no final do processo) podem ser desprezadas. Isto significa que o sistema 
inicial é equivalente ao sistema: 

Í2x - y = 3 
x + Ay - 2 

associado à matriz Bj. 

Usamos dizer também que, neste caso, as duas primeiras equações são 
“independentes” e que as demais são “dependentes” destas. Você vai se fami¬ 
liarizar com estas denominações no Capítulo 4. Ainda segundo esta terminolo¬ 
gia denominamos posto de uma matriz ao número de linhas “ independentes ” 
desta. Você pode observar que uma linha será “dependente” de outras (isto é, 
será igual a zero no final do processo de redução) se ela puder ser escrita co¬ 
mo soma de produtos destas outras linhas por constantes. Costumamos dizer 
também que esta linha é uma combinação linear das outras. Por exemplo, na 
matriz B podemos dizer que a primeira e a segunda linhas sao independentes, 
enquanto que a terceira e a quarta são combinações lineares das duas primeiras 

linhas. 

Você viu assim que um posto da matriz ampliada de um sistema nos da o 
número de equações independentes deste. Na próxima secção veremos que o 
posto também está relacionado com o número de soluções de um sistema. 


Sistemas de Equações Lineares 41 


2.5 SOLUÇÕES DE UM SISTEMA DE EQUAÇÕES LINEARES 

O objetivo desta secção é estudar detalhadamente todas as situações que po¬ 
dem ocorrer na resolução de um sistema linear. 

2.5.1 Se tivermos um sistema de uma equação e uma incógnita 

ar = b 

existirão três possibilidades: 

0 a ¥= 0. Neste caso a equação tem uma única solução 

b 

x = — 
a 

ii ) a = 0 e b = 0. Então temos Qr = 0 e qualquer número real será solução 
da equação. 

iii) a = 0 e b ^ 0. Temos 0x - b. Não existe solução para esta equação. 

Para analisar sistemas de duas equações e duas incógnitas, vejamos alguns 
exemplos. 

2.5.2 Exemplos 

Exemplo 1: 

J~2x } + x 2 = 5 
L*, - 3x 2 = 6 

Lembramos que o conjunto de pontos (x Xi x 2 ) € R X R, que satisfaz cada 
equação deste sistema, representa uma reta no plano. Para resolver este sistema 
devemos então encontrar os pontos comuns a estas duas retas. 


xi 


Figura 2.5.1 

Deste modo, (3, -1) é a única solução. A matriz ampliada do sistema é 
. Transformando-a em matriz-linha reduzida à forma escada, 
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obtemos 


1 0 3l 

0 1 -lj* 


que é a matriz ampliada do sistema 


*i =3 
*2 = -1 


equivalente ao sistema inicial. O sistema tem uma única solução x, - 3 e 
x 2 = -1, como foi analisado graficamente. Observamos que o posto da matriz 

dos coeficientes do sistema reduzido ^ e o da matriz ampliada 

F 1 0 fl é 2. 

0 1 -1 


Exemplo 2: 


2x, + x 2 = 5 
6xi + 3x 2 — 15 


As duas retas que formam este sistema são coincidentes. 



Figura 2.5.2 

Neste caso, vemos geometricamente que qualquer ponto de uma das retas é 
solução deste sistema. A matriz ampliada do sistema e a matriz reduzida por 
linhas à forma escada são: 


2 1 5 
6 3 15 


1 -L A 

1 2 2 

0 0 0 


Portanto, o sistema acima é equivalente ao sistema 


1 5 

x, + y*2 - ~2 

Qxj + 0*2 - 0 
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onde a segunda equação pode ser simplesmente “ignorada”, pois não estabelece 
nenhuma condição sobre Xj ou x 2 . Ela é verdadeira para quaisquer números Xj 
e x 2 . O conjunto de soluções deste sistema será dado, atribuindo-se valores 
arbitrários para a incógnita x 2 e tomando Xj - —L* 2 . Assim, para x 2 = X 

temos: 



x 2 — \ 


Atribuindo diversos valores para X, obtemos várias soluções para o sistema. Por 

exemplo, para X - 0, temos x, ^ e x 2 = 0. Para \ = I, temos x, = 2 e 

x 2 = 1 etc. Este sistema admite infinitas soluções. 

Observe que a matriz ampliada e também a matriz dos coeficientes do 
sistema têm posto 1, pois, uma vez transformadas em matrizes-linha reduzidas 
na forma escada, elas possuem uma linha não nula. A nulidade da matriz dos 
coeficientes é 2 - 1 = 1 que é também chamada o grau de liberdade do siste¬ 
ma. Isto quer dizer que o nosso sistema apresenta uma variável livre. 

Exemplo 3 : 

[2x x + x 2 = 5 
[6x í + 3x 2 = 10 

Geometricamente, temos duas retas no plano que não possuem nenhum ponto 
em comum, pois são paralelas, e portanto este sistema não tem solução. Isto é 
mostrado na Figura 2.5.3. 



A matriz ampliada deste sistema 
duzida à forma escada 


2 1 5 "! . 
6 3 10 J e 


equivalente à matriz-linha re- 
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Portanto, o sistema inicial é equivalente a 

x, + -yx 2 = 0 
^Ox, + 0x 2 = 1 

Não existe nenhum valor de x, ou x 2 capaz de satisfazer asegundaequçã 
Assim, o sistema inicial não tem solução. Diaemos que ele « ( 

possível). Vamos oomparar a matriz de coefieientes e a ampliada, redundas 
forma escada do sistema 



Observe que o posto da matriz dos coeficientes do sistema inicial é 1 e o pos¬ 
to de sua matriz ampliada é 2. 

2.5.3 Caso Geral: Consideremos um sistema de m equações lineares com n 
incógnitas x u ..., x n . 


r 

011*1 

+ 

012*2 

+ ., 

.. + 0172*72 

= b t 


+ 

0/722*2 

+ . 

.. + 0/7271*72 

. s 

-o 

ii 


cujos coeficientes a„ e termos constantes b t são números reais (ou complexos). 
Este sistema poderá ter 


i) uma única solução: 



jtf) infinitas soluções 
iii) nenhuma solução. 

m tp o sistema é possível (compatível) e determinado . 
No nrimeiro caso, dizemos que o sisienm ^ y v r / c tor 

IN ° P j nne o sistema é possível e indeterminado . E no ter- 

No segundo caso, dizemos que o sistema \ u 

ceiro caso dizemos que o sistema é impossível (incompatível). 

Consideremos a matriz ampliada do sistema anterior e tomemos sua ma- 

triz-linha reduzida à forma escada: 
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a \n &i 

a mn mx(n + i) 

Procure entender e demonstrar (veja a secção 2.7) cada uma das afirma¬ 
ções do teorema abaixo. Leia com atenção e volte aos exemplos dados em 
2.5,2, se achar conveniente. 

2.5.4 Teorema 

0 Um sistema de m equações e n incógnitas admite solução se, e somente 
se o posto da matriz ampliada é igual ao posto da matriz dos coeficientes. 

ii) Se as duas matrizes têm o mesmo posto p e p = n, a solução será única. 

iii) Se as duas matrizes têm o mesmo posto p e p < n, podemos escolher 

n - p incógnitas, e as outras p incógnitas serão dadas em função destas. 

Para finalizarmos este assunto, convém ilustrá-lo. Dizemos no caso iii que 
o grau de liberdade do sistema é n - p. 

Em cada exemplo, é dada a matriz-linha reduzida à forma escada da ma¬ 
triz ampliada. Usamos a notação 

Pc = posto da matriz dos coeficientes e 

p a = posto da matriz ampliada. S e p c = Pa denotamos simplesmente por 

P ■ 

2.5.5 Exemplos 

Exemplo 1 : 

~1 0 0 3~ 

0 10-2 

0 0 1 2 

m = 3, « = 3 e p = 3. Então, a solução é única e x x = 3, x 2 = -2 e *3 = 2. 
Exemplo 2: 

1 0 7 -10 

0 15-6 





Pc = Pa = 2 
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m = 2 „ = 3ep = 2. Temos um grau de liberdade: x, = -10 - 7* 3 e x 2 
= -6 - 5x 3 . 

Exemplo 3 : 

'l 0 7 -10~ 

0 15-6 

0 0 0 2 _ 

m = 3, n = 3, Pc = 2 e p a = 3. O sistema é impossível e, portanto, não existe 
solução. 

Exemplo 4: 

’l 0 -10 -2 -10 

0 1 7 1 4 Pc = Pa = 2 

0 0 0 0 0_ 

m = 3, n = 4 e p = 2. Temos dois graus de liberdade: x, = -10 + 10x 3 + 2x 4 
e x 2 = 4 - 7x 3 - *4- 

2 56 Agora, depois de termos mostrado como é possível resolver sistemas 
de equações lineares através de matrizes, podemos voltar ao problema que ha- 
«Uos proposto no início do capítulo, relativo à quantidade de hidrogemo e 
oxigênio necessária para se formar a água. 

Sabemos que 

xH 2 + y0 2 —* zHjO 
onde x, y, z devem satisfazer 

Í2x - 2z = 0 
]2y - z = 0 

A matriz ampliada, associada ao sistema é 

~2 0-2 0 
0 2 -1 0_ 

que, reduzida à forma escada, dá 



Sistemas de Equações lineares 47 


ou seja, z é uma variável livre e, assim, se tomarmos z = X, teremos 



Note o significado de termos um grau de liberdade na solução deste 
sistema. Temos apenas estabelecida a proporção com que os elementos devem 
entrar na reação, e, para diferentes valores de X, teremos quantidades diferentes 
de reagentes produzindo quantidades diferentes de água. Por exemplo, 
se X = 2, teremos 2H 2 + 0 2 -► 2H 2 0 
se X = 4, teremos 4H 2 + 20 2 4H 2 0 


2.5.7 Exemplos 

Exemplo 1\ Resolver o sistema 

f x + 2y + z + t = 0 

j > x + 3 g p-z + 2r = 0 

A matriz associada ao sistema é 

[l 2 1 1 0l 

[l 3 -1 2 oj 

que reduzida à forma escada fornece 

’l 0 5-1 o' 

0 1-2 10 

Reinterpretando o sistema, vemos que z e t são variáveis livres (grau de liber¬ 
dade 2). Chamando z = q t = X 2 obtemos: 

x - -5 Xi + X 2 
y = 2X x - X 2 
z - Xi 
t = X 2 
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ou, na forma matricial 


Observe que [- 5 2 1 0]' e [1 - 1 0 1]' são soluções do sistema ob¬ 
tidas da seguinte forma: a primeira, fazendo X, = 1 e X 2 = 0, e a segunda, 

Xi = 0 e Á 2 = 1. Elas são chamadas soluções básicas do sistema porque geram 
todas as outras. Todo sistema homogêneo tem solução que pode ser escrita 
desta forma. Basta reduzir o sistema, observar as variáveis livres e atribuir 
valores 1 para uma delas e zero para as outras, obtendo as soluções básicas 
(tantas quanto o grau de liberdade). A solução será uma soma destas soluções 
multiplicadas por constantes. 

Exemplo 2\ Resolver o sistema 

í x + 3y + z = 0 
\ 2x + 6y + 2z = 0 
[-x -3 y - z = 0 


A matriz associada é 


-1 -3 -1 0 


que reduzida torna-se 13 10 

0 0 0 0 

0 0 0 0 

Reinterpretando, vemos que y e z são variáveis livres. 
Fazendo y = Xi e z = X 2 , temos 

x = -3Xj - X 2 
y = h 

z = X 2 

As soluções básicas são então: x =-3, y = l,z = 0ex = 

Assim ^ n r t -> 

x -3 -1 

y = Xi 1 + X 2 0 

2 J 0 J L 1 . 

Exemplo 3 : Resolver o sistema 


-\,y = 0, z = 1. 


x + 2 y + z + t = 1 
x + 3y-z + 2t = 3 
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4. Calcule o posto e a nulidade das matrizes da questão 3. 

f- 

5. Dado o sistema 3 * + 5^ =1 

■ 2x + z = 3 
5 a: + y - z - 0 

escreva a matriz ampliada, associada ao sistema e reduza-a à forma escada 
reduzida por linhas, para resolver o sistema original. 

6 . Determine k, para que o sistema admita solução. 

-4* + 3y = 2 

4 5x - 4y = 0 

2x - y = k 

7. Encontre todas as soluções do sistema 

+ 3*2 + 2*3 + 3*4 - 7*5 - 14 

< 2xj + 6* 2 + *3 - 2*4 + 5 * 5 = -2 

*1 + 3*2 - *3 + 2*5 = *1 

8 . Explique por que a nulidade de uma matriz nunca é negativa. 

9. Foram estudados três tipos de alimentos. Fixada a mesma quantidade (1 g) 
determinou-se que: 

0 O alimento I tem 1 unidade de vitamina A, 3 unidades de vitamina B e 
4 unidades de vitamina C. 

ii) O alimento II tem 2, 3 e 5 unidades respectivamente, das vitaminas A, B 
e C. 

«0 O alimento III tem 3 unidades de vitaminas A, 3 unidades de vitamina C 
e não contém vitamina B. 

Se são necessárias 11 unidades de vitamina A, 9 de vitamina B e 20 de vita¬ 
mina C, 

a) Encontre todas as possíveis quantidades dos alimentos I, II e III, que for¬ 
necem a quantidade de vitaminas desejada. 

b) Se o alimento I custa 60 centavos por grama e os outros dois custam 10, 
existe uma solução custando exatamente Cr$ 1,00? 


Resolva os sistemas seguintes achando as matrizes ampliadas linha reduzidas 
à forma escada e dando também seus postos, os postos das matrizes dos 
coeficientes e, se o sistema for possível, o grau de liberdade. 
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10. *1 + 2*2 - *3 + 3*4 = 1 

n.r* + >> + 2 = 4 

J^2* + 5y - 2z = 3 

12. f * + ^ + 2 = 4 

J 2* + 5y - 22 = 3 

* + ly - lz = 5 

13. f * - 2y + 3z = 0 

[_2* + 5y + 6z = 0 

14. *j + * 2 + *3 + *4 = 0 

*! + *2 + *3 - *4 “ 4 

*! + * 2 “ *3 + *4 = -4 

*! - *2 + *3 + *4 = 2 

15. í" * + 2y + 32 = 0 

- 2* + y + 3z = 0 

3* + 2y + z = 0 

16. [3* + 2y - 4z = 1 

* - y + z = 3 

l x - >’ - 3z = ~3 

3* + 3 y - 5z = 0 

-* + y + 2 = 1 

_ 

17. O método de Gauss para resolução de sistemas é um dos mais adotados 
quando se faz uso do computador, devido ao menor número de operações 
que envolve. Ele consiste em se reduzir a matriz ampliada do sistema por 
linha-equivalência a uma matriz que só é diferente da linha reduzida à forma 
escada na condição b) de 2.4.1, que passa a ser: b') Cada coluna que con¬ 
tém o primeiro elemento não nulo de alguma linha, tem todos os elementos 
abaixo desta linha iguais a zero. As outras condições a, c e d são idênticas. 
Uma vez reduzida a matriz ampliada a esta forma, a solução final do siste¬ 
ma é obtida por substituição. 

Exemplo: 

f 2x t + x 2 = 5 
| jc, - 3x 2 = 6 
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a última matriz corresponde ao sistema: 

1 5 

*i + -*2 = ~2 

x 2 = -\. 

15 . _ - 

Por substituição, a’i - — = -j, ou seja, x t - i. 

Resolva pelo método de Gauss os Exercícios 14 , 15 e 16 e compare as res¬ 
postas. 

18. a) Mostre a proposição 2.4.3 para matrizes 2X2 quaisquer. 

b) Sinta a dificuldade que você terá para formalizar o resultado para matri¬ 
zes n X m, mas convença-se de que é só uma questão de considerar to¬ 
dos os casos possíveis, e escreva a demonstração. Consulte 2.7. 

19. Chamamos de sistema homogêneo de n equações e m incógnitas aquele siste 
ma cujos termos independentes, ftj, são todos nulos. 

a) Um sistema homogêneo admite pelo menos uma solução. Qual é ela? 

b) Encontre os valores de k e /?, tais que o sistema homogeneo 


2x - 5y + 2z = 0 
x + y + z=0 
2x + kz = 0 



(*) 


1 6 -8 
2 6-4 


jí 

y 

z 


0 
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onde \ G R. 

c) Verifique 



é a solução do sistema homogêneo, associado ao sistema (*), 



d) Conclua, dos itens a), b) e c), que o conjunto-solução do sistema * é o 
conjunto-solução do sistema **, somado a uma solução particular do sis¬ 
tema *. 


21. Dado o sistema 




a) Encontre uma solução dele sem resolvê-lo. (Atribua valores para x, y> z 
e w.) 

b) Agora, resolva efetivamente o sistema, isto é, encontre sua matriz-s^iução. 

c) Resolva também o sistema homogêneo associado. 

d) Verifique que toda matriz-solução obtida em b) é a soma de uma matriz- 
-solução encontrada em c) com a solução particular que você encontrou 
em a ). 

22. Altamente motivado pelos Exercícios 20 e 21, mostre que toda matriz-solu¬ 
ção de um sistema linear AX = B é a soma de uma solução do sistema ho- 
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mogêneo associado AX = 0 com uma solução particular de AX = B. Suges¬ 
tão: siga as etapas seguintes, usando somente propriedades de matrizes. 

/) Mostre que se Xo é uma solução do sistema AX = 0 e X| é uma solução de 
AX = B, então X 0 + X ( é solução de AX = B. 

ii) Se X, e X 2 são soluções de AX = B, então X, - X 2 é solução de 
AX = 0. 

üi) Use i) e ii) para chegar à conclusão desejada. 

23. Faça o balanceamento das reações: 

à) N 2 0 5 -* N0 2 + 0 2 (decomposição térmica do N 2 0 5 ) 

b) HF + Si0 2 -+ SiF 4 + H 2 0 (dissolução do vidro em HF) 

c) (NH 4 ) 2 C0 3 ■+ NH 3 + 1I 2 0 + C0 2 

24. Dado o sistema linear 

3x + 5y + 12 z - w - -3 
1 Jf + y + 4z - w = -6 
2y + 2z + w - 5 

a) Discuta a solução do sistema. 

b) Acrescente a equação 2z + kw = 9 a este sistema, encontre um valor de 
k que tome o sistema incompatível. 

25. Sabe-se que uma alimentação diária equilibrada em vitaminas deve constar 
de 170 unidades de vitamina A, 180 unidades de vitamina B, 140 unidades 
de vitamina C, 180 unidades de vitamina D e 350 unidades de vitamina E. 

Com o objetivo de descobrir como deverá ser uma refeição equilibrada, 
foram estudados cinco alimentos. Fixada a mesma quantidade (1 g) de cada 
alimento, determinou-se que: 

0 O alimento I tem 1 unidade de vitamina A, 10 unidades de vita mina B, 

1 unidade de vitamina C, 2 unidades de vitamina D e 2 unidades de 
vitamina E. 

ii) O alimento II tem 9 unidades de vitamina A, 1 unidade de vitamina B, 

0 unidades de vitamina C, 1 unidade de vitamina D e 1 unidade de 
vitamina E. 

iii) O alimento III tem 2 unidades de A, 2 unidades de B, 5 unidades de 
C, 1 unidade de D e 2 unidades de E. 

iv) O alimento IV tem 1 unidade de A, 1 unidade de B, 1 unidade de C, 

2 unidades de D e 13 unidades de E. 

v) O alimento V tem 1 unidade de A, 1 unidade de B, 1 unidade de C, 

9 unidades de D e 2 unidades de E. 

Quantos gramas de cada um dos alimentos I, II, III, IV e V devemos ingerir 
diariamente para que nossa alimentação seja equilibrada? 


Sistemas de Equações Lineares 55 


26. Necessita-se adubar um terreno acrescentando a cada 10m 2 140 g de nitrato, 
190g de fosfato e 205 g de potássio. 

Dispõe-se de quatro qualidades de adubo com as seguintes características: 
0 Cada quilograma do adubo I custa 5 ux.p. e contém 10 g de nitrato, 

10 g de fosfato e 100 g de potássio. 

ii) Cada quilograma do adubo II custa 6 u,c.p. e contém 10 g de nitrato, 

100 g de fosfato e 30 g de potássio. 

iü) Cada quilograma do adubo III custa 5 ux.p. e contém 50 g de nitrato, 

20 g de fosfato e 20 g de potássio. 

iv) Cada quilograma do adubo IV custa 15 ux.p. e contém 20 g de nitra¬ 
to, 40 g de fosfato e 35 g de potássio. 

Quanto de cada adubo devemos misturar para conseguir o efeito desejado se 
estamos dispostos a gastar 54 ux.p. a cada 10 m 2 com a adubação? 

27. Deseja-se construir um circuito como o mostrado na figura, 


+ 



onde V i = 280 V, V 2 = 100 V, V 3 = 50 V, R t = 20ÍÍ, Jt 2 = 30S2, 
* 3 - SOU, R 4 = 40Í2, R s = 100Í2. 

Dispõe-se de uma tabela de preços de vários tipos de resistências; assim 
como as correntes máximas que elas suportam sem queimar. 



De que tipo devemos escolher cada resistência para que o circuito funcione 
com segurança e a sua fabricação seja a de menor custo possível? 

Biblioteca de 
Ciência & Tecnolõc 
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28. Uma placa quadrada de material homogêneo é mantida com os bordos AC 
e BD à temperatura de 20°C, o bordo AB a 40°C e CD a 10°C, com o 
uso de isolantes térmicos em A, B, C e D (vide figura). 


y i 

' 40°C 



A B 


20° C 


20°C 


C D 



10°C 

X 


Após ser atingido o equilíbrio térmico, qual é a temperatura aproximada 
em cada ponto da placa? 

29. Consideremos uma unidade de produção (muito simplificada) de um proces¬ 
so de produção industrial de um determinado composto C a partir de certos 
compostos A e B (segundo a reação química A + B * C): 



A 0 = 100 kg/h, B 0 = 100 kg/h, C 0 = 10 kg/h são os fluxos de alimentação, 
isto é, a quantidade de material jogada dentro da unidade de produção por 
hora, enquanto que A^ B± e Ç são os fluxos em cada estágio da produção. 
Sabe-se, ainda que: 

f) No reator a reação processa-se em condições tais que a quantidade de A 
após a reação é 0,487 da sua quantidade antes da reação, enquanto a de 
B é 0,266 e a de Cé 4,675 de suas respectivas quantidades antes da reação. 
ii) Baseado no fato do ponto de ebulição de C ser inferior ao de A e B , 
o filtro constitui-se de um destilador. Dessa forma o vapor dentro do 
filtro tem maior concentração de C do que A e B, e é continuamente 
retirado do filtro, sendo levado para um resfriador do qual obtemos o 
produto final. Enquanto isso a parte não vaporizada no destilador é 
levada de volta ao reator para ser reciclada. Tem-se a informação de 
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que a quantidade de A em forma de vapor dentro do filtro é, em um 
determinado instante, 0,5854 da quantidade de A presente naquele 
instante na parte não vaporizada, enquanto que para B eC estas rela¬ 
ções são 1,50 e 1,07 respectivamente. 

Deseja-se saber qual é o grau de concentração de Cno produto final se a 
unidade opera em condição estacionária (isto é, os fluxos de A, B e C não 
mudam com o tempo em cada estágio), sabendo que a concentração de 
Cj na mistura que passa do reator para o filtro é de 68%. 

2.6.1 Respostas 

1. x = -1, y - 2, z = 5 





17 

8 


7. JC| - 1 - 3x 2 - x 5 

*3 = 2 + *5 

x 4 = 3 + 2*5 


9. à) Sejam x, y e z as quantidades de alimentos I, II e III respectivamente. 
Então 

5 . . 8 

jc - -5 + 3z, y = 8 - 3z onde — < z < -j- 
b) Sim. x - 1, y ~ 2, z-2 


11. x 


17 

3 



y = 


Pa = 2 = Pc, g.L = 1 



13. p a = 2 = p Ci g.L = 1, x = 3z, y = 0 


15. p a = 3 = p c , gl = 0, x = y = z - 0 


19. a) X j = 0 


b)k = 2 
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23. a) 2 N 2 0 5 —► 4 NOj + 0 2 

ó) 4 HF + Si0 2 -► SiF 4 + 2 H 2 0 

c) (NH4) 2 C0 3 —* 2 NH 3 + HjO + C0 2 


27. Sugestão : Calcule as várias correntes que circulam no circuito para depois 
fazer a escolha dos tipos de resistência. Para isto use as Leis de Kirchoff : 
i) A soma das correntes que entram em um nó de um circuito é igual à 
soma das correntes que saem deste nó. 

*0 A partir de um ponto qualquer de uma malha, se a percorrermos em 
um sentido qualquer, ao voltarmos ao mesmo ponto, a soma algébrica 
das quedas de potencial é nula. 


Leve em conta as observações: 
0 " 


Neste caso, ao irmos do ponto A ao ponto B há uma queda de poten¬ 
cial dada por Ri. Se fôssemos do ponto B ao ponto A haveria uma 
queda de potencial de -Ri, ou seja, um aumento de potencial de Ri. 



Neste caso, ao irmos do ponto A ao ponto B há um aumento de po¬ 
tencial de V, ou seja, uma queda de potencial de -V. Se fôssemos de 
B até A teríamos uma queda de potencial de V. 

Aplique, então, as leis de Kirchoff ao circuito, obtendo um sistema linear. 

Generalizações do problema podem ser obtidas nas situações: 

0 Circuitos de Corrente Alternada (obtemos sistemas com coeficientes 
complexos). 

ii) Projetos de Circuito (cálculo das características dos componentes para 
que o circuito tenha certas especificações). 
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28. Sugestão : Sabe-se que a equação que rege o fluxo de calor é dada por: 

0 ) 

onde í é a temperatura num ponto (x, y) e no instante de tempo r e 
c>0é uma constante característica do material de que é feita a placa. 

òT 

No equilíbrio térmico T não varia mais com o tempo e, portanto, 0; 
a equação se torna 

ai) 

e o problema se converte em achar T\x y y) satisfazendo (II) e tal que T 
tem um valor pré-fixado no bordo da placa. 

Modelo Aproximado : Substituímos a placa por uma “aproximação discreta” 
que consiste em uma malha (espera-se que quanto mais fina a malha melhor 
seja a aproximação - veja a figura abaixo) 



e procuramos as temperaturas Ty nos (7, /') da malha que devem satisfazer 
a condição dada nos bordos e uma equação que é uma aproximação de (II). 
Para obter a aproximação de (II) temos, num ponto (/, j) do interior da 


malha: 


a 2 r 

_ 7f+i,/ “ + T, 

9 * 2 <«,/> 

h 2 

ò 2 t 

^ j + i ” 2 Tjf + Tj 

W <i,f> 

h 2 
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substituindo em (II) e simplificando obtemos então: 


(III) 7> = 


7/+1,/ + Ti-ij + 1 \j+i + Tfj. i 


(Observe que a temperatura num ponto do interior da malha deve ser a 
média aritmética das temperaturas dos seus vizinhos mais próximos.) 
Impondo a condição (III) nos pontos do interior da malha na figura acima, 
obtemos um sistema linear. Resolva-o! 

O que seria modificado se a “abertura** da malha na vertical fosse diferente 
da “abertura” na horizontal? Seriam necessárias mais informações sobre a 
placa? E se o formato da placa fosse diferente? 


Sugestão: O modelo teórico é construído baseado no seguinte fato: a massa 
que entra em um determinado estágio deve ser igual à massa que sai. 

Usando este fato em cada estágio, assim como as informações dadas no pro¬ 
blema, obtemos um sistema linear. Resolva-o e interprete os resultados. 
Você acredita neles? Os dados são reais? 


2.7 DEMONSTRAÇÕES 

Nesta seção, faremos com detalhes as provas dos teoremas 2.4.3 e 2.5.4, que 
omitimos anteriormente, para não prejudicar a seqüência de exposição do assun¬ 
to. Estas demonstrações são apresentadas como matéria adicional, podendo ser 
estudadas ou não, dependendo de seu interesse. 

2.7.1 Demonstração do Teorema 2.4.3: Toda matriz é linha equivalente a 
uma única matriz-linha reduzida à forma escada. 


Demonstração 

1? Parte : Seja A uma matriz m X n qualquer. Se todo elemento da primeira 
linha de A é zero então a condição (a) está satisfeita, no que diz respeito a 
esta linha. Se a primeira linha tem algum elemento não nulo, seja k o menor 
inteiro j tal que a ,y ^ 0. Multiplicamos a primeira linha por l/a,y e a condição 
(a) ficará satisfeita. Agora, para cada i > 2 somemos (- a ,*) vezes a primeira 
linha à r-ésima linha. Como resultado, teremos uma matriz cujo primeiro ele¬ 
mento da primeira linha é 1 e ocorre na coluna k . Além disto, todos os outros 
elementos da coluna k são nulos. 
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Consideremos agora a matriz B obtida acima. Se a segunda linha desta 
matriz for nula nada fazemos. Se houver elementos não nulos nesta linha, sqa 
a coluna k a primeira a conter um destes. Multiplicamos a segunda linha por 
1 Ib-ik* e a seguir, somando múltiplos adequados desta nova segunda linha às de¬ 
mais linhas, obtemos uma matriz cujo primeiro elemento não nulo da segunda 
linha é 1 e todos os outros elementos da coluna em que este elemento (1) se 
encontra são nulos. O importante é que neste processo não foram alterados os 
elementos b u , , e nem a &-ésima coluna da matriz B. (Por quê). 

Repetindo o procedimento acima em relação às demais linhas (3?, 4?, 
m-ésima) obteremos no final uma matriz M que é linha equivalente à inicial A, 
e que satisfaz as condições (a) e (ò) da definição 2.4.1. 

As condições ( c ) e (d) serão satisfeitas através de um número finito de 
permutações de linhas da matriz M. 

2? Parte : Assim, mostramos nesta primeira parte que toda matriz A é linha 
equivalente a uma matriz-linha reduzida à forma escada. Para mostrarmos que 
só existe uma única matriz-linha reduzida à forma escada linha equivalente a A, 
observamos primeiramente que duas matrizes-linha reduzidas à forma escada 
que são linhas equivalentes sô podem ser iguais. 

De fato, você pode observar que nenhuma das três operações com linhas 
(exceto a multiplicação de uma linha pela constante 1) pode ser efetuada numa 
matriz-linha reduzida à forma escada, sem que ela perca esta condição. (Pense 
nisto!) 

Agora, suponhamos que por operações com linhas, partimos de uma ma¬ 
triz M e podemos chegar a duas matrizes-linha reduzidas à forma escada, N e P. 
Teremos então M ^ N e M ^ P. Como as operações com linhas são reversíveis, 
isto significará que N será linha-equivalente a P, e, portanto, da afirmação desta¬ 
cada acima, N = P. 


2.7.2 Demonstração do Teorema 2.5.4 

7? Parte: Se o posto da matriz ampliada for maior que o da matriz dos coefi¬ 
cientes (menor não pode ser), então esta matriz reduzida à forma escada deve 
ter pelo menos uma linha do tipo (00 ... Qc*), com c* =é 0. Isto significa que 
o sistema associado a esta matriz (que é equivalente ao inicial) tem uma equa¬ 
ção do tipo: 

0*! + ... + 0x„ = Ck 0 

e portanto não admite solução. 

2? Parte : Por outro lado, se o posto da matriz ampliada, P, for igual ao da ma¬ 
triz dos coeficientes, temos dois casos a considerar: 
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a) se p - n, teremos a matriz-linha reduzida à forma escada: 



0 

0 



0 0 


0 0 



A solução do sistema será x { - c ly ..., x n = c n , portanto o sistema admi¬ 
te uma única solução. 

b) se p & n então p < n (pois p não pode ser maior que n , veja o Exer¬ 
cício 8 de 2.6) 

Neste caso, devemos considerar as yárias possibilidades para a matriz-linha 
reduzida à forma escada. Podemos analisar inicialmente quando esta matriz de 
posto p < n tem a forma: 

i 

j tfip+i — a \n 

I 

a p p +1 ... a pn 

0 ... 0 

0 ... 0 


— 

0 

... 

0 

0 

"K 

0 ... 

\ 

. \ 

, \ 

0 

0 

0 

0 _„. 


0 ' 

0 

... 

0 

0 

0 

... 

0 



Teremos, neste caso: x x = c x - a lp +iX p + i ... n x n 

Xp — Cp ** + + i ••• ~ a pn*n 

e o sistema terá portanto infinitas soluções, sendo x p+í , ..., x n variáveis li¬ 
vres. 
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Uma segunda forma a ser considerada para a matriz reduzida é 


2. 


0 

/ 

rA 

/ 

/ 

0 

0 

0 j flip + 2 

0 

0 


N 

0 I 

\ i 

0 

0 

... 

0 

a pp*‘i 

0 

0 


0 

0 0 

0 

0 

... 

0 

0 0 



então JC* = Ci - a lp + 2 x p + 2 +... 

X$ = “ ^2p + 2 Xp+ 2 “b-** 


*p+ 1 = Cp - a p Xp+ 2 +... + -a p/ iXn 

sendo JCj, x p + 2 , ..., x n variáveis livres. 

E assim podemos prosseguir de uma maneira sistemática e ver que em to¬ 
das as possibilidades para a matriz-linha reduzida à forma escada de posto 
p < n, teremos um sistema com infinitas soluções e n - p variáveis livres. 

Observe que na 1? parte mostramos, usando contra-recfproca, que a 
igualdade de postos entre as matrizes ampliada e dos coeficientes é uma con¬ 
dição necessária para a existência de solução do sistema. Na 2? parte mostra¬ 
mos que esta condição também é suficiente, considerando as possibilidades a) e 
b ). Ficou assim demonstrada a afirmação (í) de 2.5.4. Note ainda que também 
as condições (ii) e (iii) foram demonstradas em a) e b) respectivamente. 

Leituras Sugeridas e Referências 

1 Lipschutz, S.; Álgebra Linear ; McGraw-Hill do Brasil Ltda., Rio de Janeiro, 1971. 

2 SMSG; Matemática : Curso Colegial , vol. 3; Yale University Press, New Haven, 1965. 









DETERMINANTE E MATRIZ 
INVERSA 


3.1 INTRODUÇÃO 

Já em 250 A.C. havia exemplos da resolução de sistemas de equações através de 
matrizes, no livro chinês Nove Capítulos sobre a Arte Matemática, cujo autor é 
desconhecido. Também algumas noções ligadas a determinantes, o assunto que 
será objeto de estudo neste Capítulo, já eram conhecidas na China antiga. 

Mas, se por um lado já se utilizava a noção de determinantes no mundo 
Oriental há tanto tempo, no Ocidente este assunto começou a ser tratado espo¬ 
radicamente a partir do século XVII. Nesta época surgem trabalhos de G. W. 
Leibniz (1646-1716), de G. Cramer (1704-1752) que desenvolveu um método 
de resolução de sistemas através de determinantes, conhecido por “Regra de 
Cramer” e foi publicado em 1750 (provavelmente já conhecido por C. Maclaurin 
(1698-1746) em 1729, e alguns resultados simétricos de J. L. Lagrange (1736- 
-1813). 

Só no século XIX é que os determinantes passaram a ser estudados mais 
sistematicamente, a começar pelo longo tratado de A. L. Cauchy (1789-1857) 
em 1812, tendo sido realizados, em seguida, trabalhos de C. G. Jacobi (1804- 
-1851). 
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A partir de então, o uso de determinantes difundiu-se muito e este con¬ 
ceito de um número associado a uma matriz quadrada mostrou-se extremamen¬ 
te útil para caracterizar muitas situações, como a de saber se uma matriz é 
inversível, se um sistema admite ou não solução, o que veremos nas próximas 
secções. 


3.2 CONCEITOS PRELIMINARES 


Consideremos o sistema ax = b com a =£ 0. A solução deste sistema éx a . 

Observe que o denominador está associado à matriz dos coeficientes do sistema, 

ou seja, [a]. 

Num sistema 2X2 

Kj*! + *12*2 = b ! 

\j*2i x l + ü 22*2 ^ b * 

resolvendo (desde que sejam possíveis as operações), encontramos 


~ ^2^12 

011022 ~ ^ 12^21 


b^a 11 ~ b\Q2\ 
011022 “ a n a 2 \ 


Observe que os denominadores são iguais e estão associados à matriz dos coe¬ 
ficientes do sistema 

tfll fl 12 
021 022 

Num sistema 3X3 


1 a 3 iX, + 032*2 + 033*3 - *3 

(desde que sejam possíveis as operações), ao procurarmos os valores de *2 
e x 3 vemos que eles têm o mesmo denominador a n a u a^ - a u a 23 a 32 - 
- 0 , 202,033 + 0,20 230 31 + 0,3*2,032 ~ 0,302203,. também eStá ^SSOciado à 
matriz dos coeficientes do sistema 


012 

013 

022 

023 

032 

033 


Vamos rever estes números que aparecem nos denominadores associados às 
matrizes (quadradas). Estes números são casos particulares do que e cham ^^ 
determinante de uma matriz quadrada. *' 


Biblioteca de 
Ciência & Tecnol 
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3.3 DETERMINANTE 

Quando nos referirmos ao determinante, isto é, ao número associado a uma 
matriz quadrada À = [ 0 , 7 ] como na secção anterior, escreveremos: 

detA ou IAI ou det [a//] 

Então v 


det [a] = a 


det 

— M 

1 _ 1 

<*12 _ <*11 
<* 22 _ <*21 

012 

022 

“ 011022 “ 

012021 

det 

a n 

012 0*3 


0 n 

012 

013 

} 

a 2X 

022 023 

= 

021 

022 

023 

= 011022033 “ 011023032 “ 012 0 21033 + 


a 3\ 

a 32 0 33 


031 

032 

033 

+ 012023031 + 013021032 "" 013023031 j 


Talvez seja conveniente avisá-lo de que o conceito de determinante no caso geral I 

envolve muitos símbolos, o que dificulta a leitura. Para tornar a discussão mais sim- I 

pies e organizada, vamos introduzir algumas definições necessárias. Comecemos f 

lembrando o que significa uma permutação . Dados n objetos distintos a i 9 .. mi a n9 f 

uma permutação destes objetos consiste em dispô-los em uma determinada > 

ordem. Por exemplo, (1 2 3) é uma permutação dos números 1, 2 e 3, l 

(2 1 3) é outra permutação etc. A quantidade de permutações de n objetos é 
dada por n\ , que é lido n fatorial e«! = n{n - 1 ){n - 2) • ... • 2 • 1 (se 
n > 0). Por exemplo 3! = 3 • 2 • 1 = 6. Define-se ainda 0! = 1. 

3.3.1 Definição: Dada uma permutação dos inteiros 1, 2, n y existe 
uma inversão quando um inteiro precede outro menor que ele. 

Consideremos as permutações de 1, 2, 3 e vejamos em cada permutação 
o número de inversões. 


Permutação 

Número de inversões 

(1 2 3) 

0 

0 3 2 ) 

1 

(2 1 3) 

1 

(2 3 1 ) 

2 

(3 1 2 ) 

2 

(3 2 1 ) 

3 


Como um outro exemplo, podemos tomar duas das 4! = 24 permutações de 1 , 
2, 3, 4. Assim, (3 2 14) tem 3 inversões e (4 3 2 1) possui 6 inversões. 
Voltemos ao determinante: 


011 

012 

013 

021 

022 

023 

031 

032 

a 33 


= 0**022033 ” a íl a 23 a 32 “ 012021033 + ^12^23^31 + a l3 a 21 a 32 ” ^13^22^31 


Observe que aparecem todos os produtos a \j x a ij 2 a 3 jy on( * e h h) sa0 as 
mutações de 1 , 2 e 3. Além disso, vemos que o sinal do termo é negativo, se a 
permutação tiver um número ímpar de inversões. (Veja a tabela acima para verificar 
os sinais.) 

Como generalização, o determinante de uma matriz quadrada [ 0 y] nX n é 
dado pela definição a seguir. 


3.3.2 Definição: det ... a njn onde J = J(j\ /„) 

P 

é o número de inversões da permutação (/*/ 2 ... /*) e P indica que a soma é 
estendida a todas as n\ permutações de (1 2 ... n ). 

Em relação a esta definição podemos fazer três observações: 

0 Se a permutação (/, j 2 ... j n ) tem um número par de inversões, o coe¬ 
ficiente (-l/ do termo correspondente na somatória terá sinal positivo; 
caso contrário, terá sinal negativo. 

ií) Em cada termo da somatória, existe um e apenas um elemento de cada 
linha, e um e apenas um elemento de cada coluna da matriz. 

iii) Através de uma reordenação conveniente dos termos, mostra-se que tam¬ 
bém é possível definir um determinante por 

detjfly] = ^ (-l/flyji fly 2 2 ... dj n n 
9 

variando os primeiros e deixando fixos os segundos índices. Verifique isto 
no caso 3X3. 
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Propriedades 

i) Se iodos os elementos de uma linha (coluna) de uma matriz A são nulos, 
det A = 0. 

A razão disto é que, pela observação (jí), em cada termo que aparece no cálcu¬ 
lo do determinante há um dos elementos da linha (coluna) nula e, portanto, 
todos os termos se anulam, e o determinante é zero. 

ii) det A = det A' 

Dai inferimos que as propriedades que são válidas para linhas também o são 

para colunas. ; 

A prova desta propriedade é a seguinte: se A = [tf/y], sabemos que A =- [by], 
onde by = ajf. Então, pela definição de determinante, temos 

det [by] = Yj ( - 1 b iy'i bjj^ ... b n j n 
9 

= Y (~^ a h ía h 2 - a inn 

P 

= det [dij] pela observação (iii). 

iii) Se multiplicarmos uma linha da matriz por uma constante, o determinan¬ 
te fica multiplicado por esta constante. 

Para verificarmos isto, chamemos de A a matriz original e B a matriz obti¬ 
da de A, multiplicando uma linha de A por uma constante k. Então, ao calcular¬ 
mos o determinante de B, pela observação («), em cada termo aparece um ele¬ 
mento daquela linha que foi multiplicada por k. Podemos colocar k em evidên¬ 
cia, e o que permanece é exatamente o cálculo do determinante de A. Portanto, 
det B = k det A. 

/v) Uma vez trocada a posição de duas linhas, o determinante troca de sinal. 

A razão disto é imediata se observarmos que ao trocar duas linhas de uma 
matriz, alteramos a paridade do número de inversões dos índices e, portanto 
trocamos o sinal dos termos. 

v) O determinante de uma matriz que tem duas linhas (colunas) iguais é zero. 

Isto é verdade porque se trocarmos as posições das Unhas que são iguais, a 
matriz e, portanto, o determinante permanecerão os mesmos. Por outro lado, 
pela propriedade anterior, o determinante deve trocar de sinal e, portanto, a 
única possibilidade é que o determinante seja nulo. 


Determinante e Matriz Inversa 69 


VÍ) d\\ a \n a i\ a ln a \\ a \n 

b(\ + c/i ... bjn + Cfá - bji ... b( n + Cf i ... Cj n 

a n i ... i ... u nn dm ... U nn 

Para mostrar esta propriedade, usamos a definição de determinante e a 
distributividade. Mas cuidado! Observe que aqui temos a soma numa linha, e 
não uma soma de matrizes. De um modo geral, o determinante de uma soma 
de duas matrizes não é igual à soma dos determinantes das matrizes. Ou seja, 
det (A + B) ¥= det A + det B. Veja o Exercício 4 da secção 3.10. 

vii) O determinante não se altera se somarmos a uma linha outra linha mul¬ 
tiplicada por uma constante. 

Exempb: 3-2 1 3-2 1 

2 5 0 = 2 5 0 

2 4 -2 8 0 0 

Aqui, à terceira linha, somamos a primeira linha multiplicada por 2. Para pro¬ 
var esta propriedade usamos as propriedades (ví), («0 e ( v )- 

viii) det (A ■ B) = det A • det B 

Mostre, inicialmente, esta propriedade para matrizes 2X2. Sinta a difi¬ 
culdade que se teria para demonstrá-la já em matrizes 3 X 3. A demonstração 
deste resultado para matrizes n X n é bem mais elaborada, mas você terá con¬ 
dições de fazê-la usando matrizes elementares (veja a seção 3.8). 

A próxima propriedade é tão importante e util no cálculo de um deter¬ 
minante que destacamos sua importância apresentando-a numa seção separada. 


3.4 DESENVOLVIMENTO DE LAPLACE 

Na seção 3.2 vimos que: 

Q\\ a l2 fl l3 

| A ] = a 2 1 022 023 

0 31 032 a 33 

= 011022033 - 011023032 “ 0l2021 d 33 + 012 fl 23031 + 013021032 ~ 013022031- 
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Mas, podemos escrever esta soma como: 

tf 11 ( 022^33 ” tf23tf32) “ tfn(tf2ltf33 “ tf23tf31) + tf, 3 (tf2ltf32 “ tf22tf3l) 

Ou ainda: 

tfll ^ ü23 "tf,2 ^ a23 | + *,3 ^ ^ 

a 32 tf 33 tf 31 tf 33 tf 31 tf 32 

Observe que o determinante da matriz inicial 3X3 pode ser expresso em fun¬ 
ção dos determinantes de submatrizes 2X2, isto é, 

det À = tfiiI An | - a 12 lA 12 I + tfi 3 ! A 13 | 

onde Ay é a submatriz da inicial, de onde a i-é sima linha e a j-é sima coluna 
foram retiradas. Além disso, se chamarmos 

Aj; - (“1) ,+/ IA//I 

obtemos a expressão 

detA = tfnA n + tf 12^12 ^ tfi3^i 3 

Esta propriedade continua sendo válida para matrizes de ordem n l , e assim po- 
demos expressar: 

det A/ix/i — tfíiAíi + 


= £ a,y(-l)' +/ det Ay 


= E a n^n 

Ao número A,y (que é 0 determinante afetado pelo sinal (-l) í+/ da submatriz 
Ajj\ obtida de A retirando-se a /-ésima linha e a /-ésima coluna), chamamos 
cofator ou complemento algébrico do elemento a(j . Observe que na fórmula da¬ 
da, o determinante foi “desenvolvido” pela /-ésima linha. Uma forma análoga é 


válida para as colunas. 


3.4.1 Exemplos 

Exemplo 1: 

- 1 

1 1 
i 

_ 1 

CJ 

IA1 = 

2 | l| -1 


-2 ! -1 ! 2 

1 _ 1 


*Paia uma demonstração, veja por exemplo Lipschutz, S Álgebra Linear , McGraw-Hill do 
Brasil Ltda., Rio de Janeiro, 1971. 
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A ,2 - (- 1) 1 


-2 2 


A 22 = (- 1 ) 2 H _2 2 = 8 


^32 = (-1) 3 * 2 5 _i = 7 


Portanto 


(-2)(~2) + 1-8 + (-1)7 = 5 


O desenvolvimento de Laplace é uma fórmula de recorrência que permite 
calcular o determinante de uma matriz de ordem /?, a partir dos determinantes 
das submatrizes quadradas de ordem n - 1 . Em grande parte dos casos ele sim¬ 
plifica muito o cálculo de determinantes, principalmente se for utilizado um 
conjunto com outras propriedades dos determinantes. 

Exemplo 2\ 


1 

-2 

3 

1 

-2 3 

2 

1 

j (W0 

2 

1 -1 

-2 

-1 

2 

0 

0 I 


1 -2 

2 1 


1 • (1 + 4) = 5 


O índice acima da igualdade indica 0 número da propriedade usada. Neste caso, 
somamos a segunda linha à terceira. 

Exemplo 3: 


-1 

2 

3 

-4 


-5 

2 

3 

-4 

4 

2 

0 

0 

(WÜ 

0 

2 

0 

0 

-1 

2 

-3 

0 


-5 

2 

-3 

0 

2 

5 

3 

1 


-8 

5 

3 

1 



-5 

3 

-4 

5 

-3 

4 

10 

0 

4 

= 2(-l) 2+a 

-5 

-3 

0 -2 

5 

3 

0 ( = ò) -2 

' 5 

3 

0 


“8 

3 

I 

8 

-3 

-1 

13 

0 

-1 


- (-2)(3)(-l) 2 


10 4 

13 -1 


-6(-10 - 52) = 372 
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Note que na primeira passagem usamos a sétima propriedade ao somarmos a se¬ 
gunda coluna multiplicada por 2 à primeira coluna. Nosso intuito foi o de 
obter uma segunda linha com apenas um elemento não nulo, e então abaixar a 
ordem do determinante, usando menos cálculos. Seguindo este raciocínio, você 
pode também obter o determinante inicial, por exemplo, igualando o último 
elemento da primeira linha a zero. 


3.5 MATRIZ ADJUNTA - MATRIZ INVERSA 

Dada uma matriz A, lembramos que o cofator A,y do elemento ajj da matriz é 
(— 1 ) ,+/ det A,y, onde A z y é a submatriz de A, obtida extraindo-se a í-ésima linha 
e /-ésima coluna. Com estes cofatores podemos formar uma nova matriz A, de¬ 
nominada matriz dos cofatores de A. 

Ã - [A if ] 

Exemplo : 

A = 


a„= i ; - ->•> 

A,i ■ Ml'” ~f j - 19, ... etc. 

-19 19 -19 

Então, A = -5 10 -11 

4-8 5 


3.5.1 Dada uma matriz quadrada A, chamaremos de matriz adjunta de A 
à transposta da matriz dos cofatores de A. 

adj A = Ã' 

No exemplo anterior 

-19 

adj A = 19 

-19 
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Vamos efetuar, neste exemplo, A * A\ 


- 19 

0 

0 


1 

0 

0 

0 

-19 

0 

= -19 

0 

1 

0 

0 

0 

- 19 


0 

0 

1 


= - 19 1 3 


Além disto, podemos verificar que det A = - 19. Então A • A r - (det A)I 3 . Este 
resultado não foi obtido por acaso, mas é válido para toda matriz quadrada A 
de ordem n . 


11 

tf 12 

tf 13 

21 

fl 22 

tf23 

31 

tf 32 

tf 33 


3.5.2 Teorema: A • A' = A • (adj A) = (det A)I„ 

Para demonstrarmos esta proposição, usamos a propriedade (v), segundo a 
qual o determinante de uma matriz que tem duas linhas (colunas) iguais é zero. 
e o desenvolvimento de Laplace. Vamos fazê-la esquematicamente, para matrizes 
3 X 3. A demonstração é a mesma para matrizes n X n. 

Prova: (n = 3) 


A 3l 

^ 32 ~ [Cjj] 

A33 


Calculando os elementos c,y, achamos que 

Cu = tfiiAu + a n A 12 + tfi3A 13 = det A. 
c 12 = a uA 2 i + a \iA 2 i + fl i 3 A 2 3. 

Usando o desenvolvimento de Laplace em relação à segunda Unha, temos: 

a \\ a l2 a \3 

c 12 det a n a V2 a l3 = 0 

# 3t tf 32 tf 33 

pois duas linhas são iguais. Analogamente, 

Cjj - det A e Cjj = 0 se i ¥= j 


Então: 


det A 0 0 

A - (adj A) - 0 det A 0 = (det A)I 3 

0 0 det A 


3.5.3 Definição: Dada uma matriz quadrada A de ordem n y chamamos de 
inversa de A a uma matriz B tal que A - B = B - A = I„, onde I« é a matriz 
identidade de ordem n. Escrevemos A ' 1 para a inversa de A. 
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ou seja, A ■ B = I. Também 



ou seja, B • A = I e, portanto. 



é a inversa da matriz A. (B = A" 1 ). 

Observações: 

i) Se A e B são matrizes quadradas de mesma ordem, ambas inversiveis (isto 
é, existem A' 1 e B' 1 ), então A • B é inversível e (AB)' 1 = B" 1 ■ A -1 . 

De fato, basta observar que (AB)(B"‘ A' 1 ) = A(BB'')A'' = AIA" 1 = 

= AA~‘ = 1 e que, analogamente (B"'A" 1 )(AB) = I. 

//) Se A é uma matriz quadrada e existe uma matriz B tal que BA = I, 
então A é inversível, ou seja A" 1 existe e, além disso, B = A -1 . 

Em outras palavras, basta verificar uma das condições para a inversa de 
uma matriz, e esta será única. 

A prova da primeira parte, ou seja, de que A” 1 existe, será feita em 
3.8.6. Por ora, mostraremos apenas que B = A" 1 . De fato, se A -1 existe, temos 
a seguinte seqüência: B = BI - B(AA* 1 ) = (BA)A"' = IA= A -t . 

iií) Nem toda matriz tem inversa. 

Por exemplo, para mostrar que jjj não tem inversa, é suficiente 

mostrar que a equação matricial Qj 1 J j^c dj = [o f\ nío tem solu Ção. 
Isto é verdade, pois 

Í2 c 2dl = H 0~] 

L c d J ~ |_0 1 J 

implica que 2c - 1 e c = 0, e não podemos ter estas igualdades simultanea¬ 
mente. 
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Suponhamos agora que \ nxn tenha inversa, isto é, existe A' 1 tal que 
A • A -1 = Itf. Usando o determinante temos 

det (A * A" 1 ) = det A • det A -1 e det l„ = 1 

Então: 

det A * det A -1 = 1 
Desse produto concluímos que se A tem inversa, 
i) det A ^ 0 

e det A '' = d^r 

Ou seja, det A =£ 0 é uma condição necessária para que A tenha uma inversa. 
Vamos ver que esta condição também é suficiente. Já vimos em 3.5.2 que 

A • Ã’ = (det A)l. Se det A * 0, A . • Ã’ = I * como a inversa é úni- 

- .-i 1 i- 

ca, então A = , - A - • A . 

’ det A 

Em resumo: 

3.5.5 Teorema: Uma matriz quadrada A admite uma inversa se, e somente se 
det A ^ 0. 

Neste caso: 

5iÃ (, “ liA, 

Este resultado nos fornece um novo método de calcular a inversa de uma 
matriz. Consideremos a matriz do Exemplo 2 anterior: 


det A = 24 - 22 = 2 =£ 0 e, portanto, existe a inversa de A. Calculemos sua 
inversa pela relação A " 1 = ^ ^ (adj A). 


À = _2 6 adjA= -lí 1 


, 1 1 4-2 

A = d*Ã (adjA) = T-n 6 


Então 
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3.6 REGRA DE CRAMER 

O cálculo da inversa de uma matriz fornece um outro método de resolução de 
sistemas lineares de equações. Este só se aplica a sistemas lineares em que o nú¬ 
mero de equações é igual ao número de incógnitas. Suponhamos que desejásse¬ 
mos resolver o sistema linear de «-equações e «-incógnitas. 

f *11*1 n x n ~ b\ 


+ •** + a nn x n ~ bn 

Podemos escrever este sistema na forma matricial 





a matriz das incógnitas. Para esta equação suponhamos que det A ^ 0 e por¬ 
tanto, que A tenha a inversa A" 1 . Então 

A _l (AX) = A " 1 B 
(A -1 A)X = A " 1 B 
I„X = A 1 B 
X = A -1 B 

Na forma matricial 
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Usando a relação para matriz inversa dada em 3.5.4, temos 

Xj A n ... b\ 

_ _ 1 _ . . . 

det A : 

x n ... "n 

Então , A 

+ ... + b n A n \ 

Xl ~ “ deTA 

Mas note que o numerador desta fração é igual ao determinante da matriz que 
obtemos de A, substituindo a primeira coluna pela matriz dos termos indepen- 
dentes. De fato, usando o desenvolvimento de Laplace, obtemos. 


b\ Ü 12 *i 


b n a n 2 ■■■ a n 


= òiAii + ... + b n &n 


Ou seja 



*12 * 

a in 

bn 

a n 2 

• • “nn 

*11 

*12 

a in 

*m 

a m 

*rm 


Fazendo deduções análogas, obtemos 


*ii 

b . 

a ln 

*nl 

bn 

... a nn 

*u 


*1 n 

*ni 

... 

a nn 


para i = 1,2, ..., n. 


Observe que no denominador temos o determinante da matriz dos coeficientes 
(det A i 0), e no numerador aparece o determinante da matriz obtida de A, 


Determinante e Matriz Inversa 79 


substituindo a í-ésima coluna pela coluna dos termos independentes. Este méto¬ 
do de resolução de um sistema linear de n equações e n incógnitas, que só po¬ 
de ser aplicado quando o determinante da matriz dos coeficientes for não nulo, 
é chamado Regra de Cramer. 

3.6.1 Exemplo 

Dado o sistema de 3 equações e 3 incógnitas: 

2x - 3y + 72 =: 1 
- x + 3z = 5 
2 y - z = 0 

temos 

"2-3 7" 

det 1 0 3 = -1 ± 0 

_0 2 - 1 ^ 

Portanto, podemos usar a Regra de Cramer. 

Então: 

1 -3 7 
5 0 3 

0 2-1 

x =-= -49 

-1 



2 -3 1 

1 0 5 

0 2 0 

z =-= 18 

-1 

Cabe aqui um comentário sobre a Regra de Cramer. Embora seja muito 
útil, pois dá uma forma explfcita das soluções de um sistema, ela não é muito 
usada para cálculos numéricos. Isto porque o número de operações que ela 
envolve é muito grande, quando trabalhamos com muitas equações. No cálculo 
do determinante de uma matriz de ordem n , temos que calcular n\ produtos 
de n fatores, e depois somá-los. (Veja a definição.) Efetuamos então n\(n - 1) + 
+ («! ~ 1) = n\n - 1 operações. Como para resolver um sistema n X n pela 
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Regra de Cramer precisamos calcular n + 1 determinantes de ordem n, o núme¬ 
ro de operações se elevaria a {n + l)(«!n - 1), que é maior que n 2 n \. 

Como um exemplo, para resolvermos um sistema de 10 equações e 10 
incógnitas, pela Regra de Cramer teríamos um número de operações superior a 
10 2 10! = 362.880.000 operações, enquanto que pelo método de redução de li¬ 
nhas não chegaríamos a 14.000. 

Muitos dos problemas que aparecem em Engenharia, Economia, Biologia 
etc., costumam envolver um grande número de incógnitas, de ordem 100 ou 
1.000, por exemplo. Nestes casos, mesmo os métodos de eliminação e redução 
por linhas podem não ser adequados. Então nos meios computacionais prefere- 
-se usar métodos numéricos iterativos (como, por exemplo, o de Gauss-Seidel). 
Estes processos iterativos serão nosso objeto de estudo no capitulo 13. 


3.7 CÁLCULO DO POSTO DE UMA MATRIZ 
ATRAVÉS DE DETERMINANTES 

Muitas vezes, é suficiente saber apenas se um sistema de equações lineares tem 
solução sem precisar resolvê-lo, isto é, sem explicitar as soluções. Por exemplo, 
ao estudar a posição relativa de duas retas no plano, dadas pelas equações 
y-2x = 3ey-3x = 2, podemos estar interessados em saber apenas se elas 
se interceptam ou não, sem determinar seu ponto de intersecção. Ou seja, que¬ 
remos saber se o sistema 

\y - 2* = 3 

\y ~ 3 * = 2 

admite ou não solução. 

Como já vimos em 2.5, a existência e o número de soluções estão relacio¬ 
nados com o posto da matriz dos coeficientes e o posto da matriz ampliada. 
Vamos ver agora uma maneira de obter o posto de uma matriz usando deter¬ 
minantes. 

3.7.1 Teorema: O posto (característica) de uma matriz A (quadrada ou 
não) é dado pela maior ordem possível das submatrizes quadradas de A, com 
determinantes diferentes de zero. 

(Para uma demonstração, deste teorema veja os exercícios 18, 19 e 20 
da seção 3.10.) 
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„,o admite soluçSo, pois o posto da matriz dos coef. cientes é diferente do pos- 
to da matriz ampliada. 

NurSfma de » equações e „ mcdgnitas, onde o determinante da rrn.tiz dos 
coeficientes é diferente de 0, existe uma umca solução. 


* 3.8 MATRIZES ELEMENTARES 

Um processo de inversão de matrizes 

o cálculo da inversa de uma matriz usando determinante, envolve um nume- 
ro muito grande de operações. O processo prático de inversão que vamos 
apresentar nesta seção é baseado nas operaçoes com as linhas de uma ma 
; P emt™os de cálculos, é muito vantajoso. O conceito de matnzes elemen- 
tàres que introduziremos aqui será utilizado para mostrar a validade deste pro¬ 
cesso e ainda para demonstrar vários resultados já enunciados em seções ante- 

n0ieS Observemos, inicialmente, que cada operação com as linhas de uma ma¬ 
triz corresponde a uma multiplicação dessa matriz por uma matriz especial. 


3.8.1 Exemplos 


Exemplo 1: Ao multiplicarmos a primeira linha da matriz 


"l 2 4 

0 1 3 

2 1 -4 


por 2, obtemos a matriz 


2 4 8 

0 1 3 

2 1 -4 


que é exatamente o produto 


2 0 0 
0 1 0 
0 0 1 


1 2 4 

0 1 3 

2 1 -4 
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Exemplo 2\ Ao trocarmos a primeira e a segunda linha da matriz A acima, 
obtemos 

0 1 3 

1 2 4 

2 1 -4 


Este resultado é o mesmo que o produto 


0 1 0 
1 0 0 
0 0 1 


Exemplo 3\ Ao somarmos à primeira linha da matriz A a segunda linha 
multiplicada por 2, obtemos 


que é o mesmo que o produto 


12 0 12 4 

0 10 0 1 3 

0 0 1 2 1-4 


Observando mais cuidadosameníe estes exemplos, vemos que aplicar uma 
operação elementar nas linhas da matriz A é o mesmo que aplicar esta opera¬ 
ção elementar na matriz identidade e, em seguida, multiplicar esta nova matriz 
por A. Vejamos isto em outros exemplos. 

Exemplo 4: Se tomarmos a matriz identidade I 3 e trocarmos a primeira e 
a terceira linha, obteremos a matriz 


0 0 1 
0 1 0 
1 0 0 


Se multiplicarmos esta matriz pela matriz A do exemplo 1, teremos 


0 0 1 1 2 4 2 1 -4 

0 10 0 1 3 = 01 3 

1 0 0 2 1 -4j \J 2 4 


cujo resultado é exatamente a troca da primeira e terceira linha da matriz A. 
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Exemplo 5 : Se tomarmos I 3 e somarmos à terceira linha a segunda multi- 
plica da por -3, obteremos 



Se multiplicarmos esta matriz pela matriz A do Exemplo 1, teremos 



Este resultado é exatamente aquele que obtemos se somarmos à terceira m a 

de A a segunda multiplicada por -3. _ , . 

Através desses exemplos podemos perceber que existe uma relaçao intima 
entre as operações com Unhas de uma matriz e certas matrizes especiais cons¬ 
truídas a partir da matriz identidade. Estas matrizes serão denominadas matn- 
zes elementares. 

3.8.2 Definição: Uma matriz elementar é uma matriz obtida a partir da 
identidade, através da aplicação de uma operação elementar com Unhas. 

O relacionamento entre matrizes elementares e operações com Unhas é 
dado pelo teorema abaixo. 

3.8.3 Teorema: Se A é uma matriz, o resultado da apUcação de uma ope¬ 
ração com as Unhas de A é o mesmo que o resultado da multiplicação da ma¬ 
triz elementar E correspondente à operação com Unhas pela matriz A. 

A prova deste resultado poderá ser feita por você. Consiste apenas em 
escrever a matriz E, efetuar o produto E • A e verificar que o resulta o o ti¬ 
do é o esperado. Este procedimento deve ser efetuado para cada tipo de opera¬ 
ção com Unhas. Uma conseqüência importante da proposição anterior é. 

3.8.4 Corolário: Uma matriz elementar E t é inversível e sua inversa é a 
matriz elementar E 2 , que corresponde à operação com linhas inversa da opera- 
çao efetuada por Ej. 

Por exemplo, se E, é a matriz elementar cuja operação consiste em mul- 
tipUcar uma determinada Unha por k, a matriz inversa de E, será a matnz^ele- 
mentar E 2 que corresponde à operação de multiplicar a mesma linha por -j. 
prova deste corolário é deixada a seu encargo. 
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Como conseqüência do resultado anterior, podemos mostrar agora o teo- 
rema 2.3.1. 


3,8.5 Teorema: Sistemas associados a matrizes linha equivalentes são equi¬ 
valentes. 

Prova : Sejam A e A' matrizes-linha equivalentes. Por 3.8.3 
A' = MA, onde M é um produto de matrizes elementares e, portanto, inver¬ 
sível (veja 3.8.4 e (/) de 3.5.4). Os sistemas (I) e (II) que têm AeA' como 
matrizes ampliadas podem ser escritos respectivamente: 

N * X = B e N'X ^ B', onde N é a submatriz de A da qual se retirou a 
última coluna e B é esta coluna. (Idem para N', A' e B\) Além disto, você po¬ 
de verificar que 

N' = M • N e B' = M • B. 

Portanto, NX = B MNX = MB N'X = B\ 

Isto significa que os sistemas (1) e (II) são equivalentes pois toda matriz 


que seja a solução do I será solução de II e vice-versa. 


3.8.6 Usando os resultados 3.8.3 e 3.8.4 podemos também completar 
agora a demonstração da observação (ií) de 3.5.4. Repetindo-a da maneira co¬ 
mo foi enunciada: Se A é uma matriz quadrada e existe uma matriz B tal que 
BA = 1, então A é inversível, ou seja, A -1 existe e B - A l . Já havíamos mos¬ 
trado que se A é inversível, então B = A l . Mostremos agora que A é realmen¬ 
te inversível. 

Comecemos analisando o sistema de equações lineares que corresponde a 
AX = 0, onde X é um vetor coluna e 0 é o vetor-coluna cujos elementos são 
nulos. Observamos que a única solução possível para esse sistema é X = 0 pois, 
multiplicando AX = 0 por B, temos 0 = B 0 - B(AX) - (BA)X - IX - X. 
Por outro lado, se resolvermos o sistema AX = 0 através de operações com li¬ 
nhas, obteremos um sistema equivalente RX = 0, onde R é a forma escada li¬ 
nha reduzida de A e, portanto, R = E&Efr-i — EiA. Mas, como o sistema 
RX = 0 é equivalente a AX = 0, a sua única solução é X = 0, e como R está 
na forma escada linha reduzida, a única possibilidade é R - I. Então ^ 

I = E*E*_i ... Ei A, e, multiplicando sucessivamente por E*\ E*^, ..., E, 

(que são matrizes elementares, como vimos na seção 3.8.4), teremos 
A = E^EJ 1 E* 1 , ou seja, A é um produto de matrizes elementares e, pela 
observação (i) de 3.5.4, é inversível. 
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* 3.9 PROCEDIMENTO PARA A INVERSÃO DE MATRIZES 

Com argumentos análogos aos usados em 3.8.5 você pode provar o teorema enun 
ciado a seguir. 

3 9 1 Teorema: Se A é uma matriz inversível, sua matriz-linha reduzida a 
forma esotda, R, é a identidade. Além disso, A é dada por um produto de ma- 

trizes elementares. 

A recíproca deste resultado irá fornecer um novo processo para se calcular 
a inversa de uma matriz A. Suponhamos que, ao reduzir A à forma escada lm a 
reduzida, a matriz identidade seja obtida como resultado. Neste caso, como a ca¬ 
da operação com Unhas corresponde uma multipUcação por uma matriz elementar, 
E/, teremos então; 

I = E* • Ejt_i • ... • E 2 • Ej • A 
= (E* . E*_, - ... • E, • E, • I)A 

Mas isto quer dizer que 

E^ • Ejt-i " ... • E 2 "Ei • I = A 
que podemos colocar em palavras através do teorema abaixo. 


3.9.2 Teorema: Se uma matriz A pode ser reduzida à matriz identidade, 
por uma seqüência de operações elementares com Unhas, então A é inversível e 
a matriz inversa de A é obtida a partir da matriz identidade, aplicando-se a 

mesma seqüência de operações com Unhas. 

Na prática, operamos simultaneamente com as matrizes A e I, através e 
operações elementares, até chegarmos à matriz I na posição correspondente à 
matriz A. A matriz obtida no lugar correspondente à matriz I será a inversa de 

A (A : I) - **(15 A"') 

Vejamos como este procedimento pode ser colocado em prática. 

3.9.3 Exemplos 

Exemplo 1 : Seja 

2 10 0 
A 10-11 
A - o 1 11 

-1 0 0 3 _ 
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Coloquemos a matriz junto com a matriz identidade e apUquemos as operações 
com Unhas, para reduzir a parte esquerda (que corresponde a A) à forma esca¬ 
da linha reduzida, lembrando que cada operação deve ser efetuada simultanea¬ 
mente na parte direita. 


2 

1 

0 

0 

í 

1 

1 

0 

0 

0 

1 

0 

-1 

1 

1 

! 

0 

1 

0 

0 

0 

1 

1 

1 

1 

1 

0 

0 

1 

0 

-1 

0 

0 

3 

1 

1 

i 

0 

0 

0 

1 


Trocando a primeira e segunda linhas, obtemos 


1 

0 

-1 

1 

1 

i 

1 

0 

1 

0 

0 

2 

1 

0 

0 

1 

1 

1 

0 

0 

0 

0 

1 

1 

1 

1 

1 

0 

0 

1 

0 

-1 

0 

0 

3 

1 

1 

* 

0 

0 

0 

1 


Agora, somamos à quarta a primeira e à segunda, a primeira linha multiplicada 
por - 2 . 


1 

0 

-1 

1 

1 0 

1 

0 

0 

0 

1 

2 

-2 

j 1 

-2 

0 

0 

0 

1 

1 

1 

! 0 

0 

1 

0 

0 

0 

-1 

4 

! 0 

i 

1 

0 

1 


Subtraímos a segunda linha da terceira, obtendo 


1 

0 

-1 

1 

1 1 

0 

1 

0 

0 

0 

1 

2 

-2 ! 

1 

-2 

0 

0 

0 

0 

-1 

3 i 

-1 

2 

1 

0 

0 

0 

-1 

4 

i 

0 

1 

0 

1 


Trocamos o sinal da terceira linha e, subseqüentemente, anulamos o resto da 
terceira coluna. 

1 0 0 -2 | 1 -1 -1 0 

0 10 4 j -1 2-2 0 

0 0 1 -3 | 1 -2 -1 0 

_0 0 0 1 | 1 -1 -1 1 _ 
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Finalmente, obtemos a identidade à esquerda e a inversa de A à direita. 


1 

0 

0 

0 

1 

1 

3 

-3 

-3 

2 

0 

1 

0 

0 

1 

1 


6 

2 

-4 

0 

0 

1 

0 

1 

1 

4 

-5 

-4 

3 

0 

0 

0 

1 

1 

1 

1 

-1 

-1 

1 


Portanto 


Exemplo 2: Seja 


Partimos de 




3 

-3 

-3 

2 


= 

-5 

4 

6 

-5 

2 

-4 

-4 

3 



1 

-1 

-1 

1 




1 0 

1 



A 


1 2 

1 





0 2 

0_ 


i 

0 

1 

1 

0 

0 

i 

2 

1 

1 0 

1 

0 

0 

2 

0 

! o 

0 

1 


e fazemos operações com linhas, para converter a parte esquerda (que corres¬ 
ponde a A) à forma escada linha reduzida. Obtemos então 


1 

0 

1 j 

1 

0 

0 

0 

1 

0 ] 

1 

‘ 2 

1 

“ 2 

0 


0 

0 j 

1 

-1 

1 


Como a forma escada não é a identidade, a matriz A nao tem inversa. 


3.9.4 Agora, iremos demonstrar a propriedade 
det (AB) = det A - det B 
conforme nos propusemos a fazer em 3.3 (vífi). 


Para isso, queremos que você descubra qual é o determinante de uma matriz 
elementar E nos seguintes casos: 

/) E é obtida de I por uma permutação de Unhas. 

ii) E é obtida de 1 pela multiplicação de uma das linhas por uma constante 
k (k =£ 0 ). 

iii) E é obtida de I pela substituição da nésima linha por k vezes a j-é sima, 
mais a i-ésima linha. 

Agpra você deverá provar o seguinte resultado. 


3.9.5 Teorema: Se E for uma matriz elementar e A uma matriz qualquer 
da mesma ordem que E, então det EA = det E - det A. 

Para provar este teorema, considere as três possibilidades para a matriz E 
(/), (ii ) e (iii) dadas acima. Tudo ficará realmente simples se você tiver chegado 
à conclusão que, em (/) temos det E = -1, em (ii) det E = k e em (iii) det E = 1. 

Finalmente, podemos demonstrar a propriedade do determinante do pro¬ 
duto. 


3.9.6 Teorema: Se A e B são matrizes n X n quaisquer, então 
det (A • B) = det A • det B. 

Prova : 

1? caso : Se A ou B são não inversfveis, temos A • B não inversivel (veja o 
Exercício 10 da seção 3.10). Neste caso, det (AB) = 0 , e como det A - 0 ou 
det B - 0, a igualdade se verifica. 

2? caso : Se A e B são inversfveis, usando 3.9.1 temos: 

det (AB) = det (E a ... E*B) 


Após sucessivas aplicações do teorema 3.9.5 chegamos a: 

det(AB) = det Ej - det (E 2 ... E*B) 

= ... = det Ei • det E 2 • ... • det E* • det B 

- det Ej • ... ■ det(E/ : _ 1 . E*) * det B 

- ... = det (Ej • E 2 • ... . E*) • det B 
= det A • det B 
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3.10 EXERCÍCIOS 

1. Dê o número de inversões das seguintes permutações de 1, 2, 3, 4, 5: 

a) 3 5 4 1 2 

b) 2 14 3 5 

c) 5 4 3 2 1 

d) No determinante de uma matriz 5 X 5, que sinal (negativo ou posi¬ 
tivo) precederia os termos <*i3<*25 a 34 a 4i<*52 e ®is**24®33®4í®si? 

2. Quantas inversões tem a permutação (n n - 1 ... 2 1) dos números 1, 2, .. 
n - 1, rí] 

~2 0 -f 

3. Calcule det 3 0 2 

_4 -3 7_ 

a) pela definição 

ò) em relação à segunda coluna, usando o desenvolvimento de Laplace. 


4. Dadas as matrizes A 

a) det A + det B 

b) det (A + B) 

5. Sejam A e B matrizes do tipo n X n. Verifique se as colocações abaixo são 
verdadeiras ou falsas. 

a) det (AB) = det (BA) 

b) det (A 1 ) - det A 

c) det (2A) = 2 det A 

d) det (A 2 ) = (det A) J 

e) det A,; < det A 

f) Se A é uma matriz 3X3, então 

íZ n A u + tf 12 Al2 + tf 1 3 ^13 - a 2l^2l + a 22^22 + fl 23^23 




calcule 


c) ^23 

d) det A 


tf) A 2 3 

&) | a 23 I 
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7. Propriedade : O determinante de uma matriz triangular \ nXn é igual ao pro¬ 
duto dos elementos de sua diagonal. 

a) Prove esta propriedade no caso em que A é uma matriz triangular supe¬ 
rior (genérica) 5X5. (Sugestão: Use e abuse do desenvolvimento de La¬ 
place.) 

b) O que você pode dizer sobre o número de soluções dos sistemas abaixo? 


5xj + 2* 2 - 3*3 + 9*4 = 0 
, -3x 2 + 9 jc 3 -y * 4 = 0 

-2*3 + *4 = 0 

*4 = 1 


3*5 ^ 2*4 t *i — 0 

- *3 + *2 - *1 = 5 

(li) i - 9*3 - *2 + 9*J = 0 

-3*2 + *1=0 

*! — 0 


8. Calcule det A, onde 


a) r~3 -1 5 




b ) r 3 0 0 0 0 

19 18 0 0 0 

A = -6 7T -5 0 0 

4 VT vT o o 
_8 3 5 6 -1_ 


9. Encontre A 1 , onde 
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10. Se A ou B é uma matriz não inversível, então A * B também nao é. Prove 
isto, sem usar determinantes. 

11. Mostre que 



Observe atentamente a igualdade acima e enuncie a propriedade que ela 
ilustra. 



14. Dizemos que A e B são matrizes semelhantes se existe uma matriz P tal que 
B = P _1 AP. Mostre que det A = det B se A e B são semelhantes. 

15. Verdadeiro ou falso? 

a ) Se det A = 1, então A“ l - A. 

b) Se A é uma matriz triangular superior e A" 1 existe, então também A 1 
será uma matriz triangular superior. 

c) Se A é uma matriz escalar n X n da forma kl n , então det A - k n . 

d) Se A é uma matriz triangular, então det A - a n + ... + a n n- 

16. Resolva o sistema, usando a Regra de Cramer: 

* - 2y + z=l 
« 2x + y =3 
y - 5z - 4 
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17. Dado o sistema 

r x + y - w - 0 
X - z + w = 2 
* v + z - w = -3 
x + y -2 w = 1 

a) Calcule o posto da matriz dos coeficientes. 

b ) Calcule o posto da matriz ampliada. 

c) Descreva a solução deste sistema. 

d) Considere um sistema homogêneo AX = 0, onde A é uma matriz n X «. 
Que condição você deve impor sobre A, para que o sistema admita solu¬ 
ções diferentes da solução trivial (X = 0)? Compare com 3.6 e o Exer¬ 
cício 18 do Capitulo 2. 

18. Prove que: Uma matriz A, com ordem n, tem posto n se, e somente se A é 
inversível. 

19. A partir do exercício acima, você pode concluir que uma matriz A, de 
ordem n, possui determinante diferente ae zero se, e somente se A tem n 
linhas linearmente independentes. Por quê? (Veja o final da secção 2.4.) 


20. Agora prove a propriedade 3.7.1, usando o exercício anterior. 


21. Mostre que a área do triângulo na figura é dada pelo determinante 



1 a 2 a\ = (a 2 - - «i)(fl3 - « 2 ) 

1 a 3 a\ 


b) Se ai, a 2 > a n sâo números, mostre por indução finita que 


d\ ■ 

.. a 1 }' 1 

a 2 . 

.. «r 1 


1 a n ... a"~ x 


n (Xj - Xi) 

i </ 


O símbolo à direita significa o produto de todos os termos Xj x; com 
i < / e /, j inteiros variando de 1 a n. 
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Sugestão : Para efetuar facilmente a indução, multiplique cada coluna por 
Xi e subtraia o mesmo da coluna imediatamente à direita, partindo do 
lado esquerdo, obtendo, então: V n = (x„ - Xj)... (x 2 - Xj) V n -i• 

Tal determinante é chamado determinante de Vandermonde. 

23. Uma maneira de codificar uma mensagem é através de multiplicação por 
matrizes. Vamos associar as letras do alfabeto aos números, segundo a 
correspondência abaixo: 

abcdefghij lmnop qrs tuvwxy 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 

Suponhamos que a nossa mensagem seja “PUXA VIDA”. Podemos formar 
uma matriz 3X3 assim: 

P U X' 

A - V , que usando a 

I D aJ 

correspondência numérica fica: 

15 20 23' 

1 0 21 = M 

9 4 1 

Agora seja C uma matriz qualquer 3X3 inversivel, por exemplo: 

"l 0 1 

C = -1 3 1 

0 1 1 

Multiplicamos nossa matriz da mensagem por C, obtendo M ♦ C. 

15 20 23] [ 1 0 ll [-5 83 58 

1 0 21 • —1 3 1 = 1 21 22 

9 4 1 J [ 0 1 lj L 5 13 14 _ 

Transmitimos esta nova matriz (na prática, envia-se a cadeia de números 
-5 83 58 1 21 22 5 13 14). Quem recebe a mensagem decodifica-a 
através da multiplicação pela inversa ((M • C) • C" 1 = M) e posterior 
transcrição dos números para letras. C é chamada matriz chave para 0 
código. 

à) Você recebeu a mensagem: 

-12 48 23 -2 42 26 1 42 29 
Utilizando a mesma chave traduza a mensagem. 


io (sq 

I A» 1 
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ti) Aconteceu que o inimigo descobriu sua chave. O seu comandante manda 

1 1 -ri 

você substituir a matriz chave por 11 0 . Você transmite a 

_0 0 2 

mensagem “CRETINO...” a ele (codificada, naturalmente!). Por que não 
será possível a ele decodificar sua mensagem? 
c) Escolha uma matriz-chave que dê para codificar palavras até 16 letras. 
Codifique e descodifique à vontade! 


3.10.1 Respostas 


1. a) 5 

b) 2 

c) 10 

d) - e + 

3. a) 21 

b) 21 



S. a) V 

b) V 

c ) F 

d) V 


7. a ) Seja A uma matriz triangular superior e desenvolva-se o determinante 
através da primeira coluna. 

(Al = a u |AmI mas A„ é triangular superior também lA,,l = a 21 IA nu 
etc. 

Então I Al = Ou ’ O 22 -• o nn . 
ti) (i) única, (ú) nenhuma. 
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11. A derivada do determinante é a soma dos determinantes das matrizes obti¬ 
das da original, diferenciando as linhas, uma por uma. 

15. a) F b) V c) V d) F 

17. a) 3 c ) Possível e indeterminado. 

b) 3 d) As linhas de A como vetores são LD. 

21. Considere as áreas do trapézio AXYC e dos triângulos AXB e CYB. 



23. b) A matriz-chave não tem inversa. 


Leituras Sugeridas e Referências 

^erstein, T.N.; Tópicos de Álgebra, Editora Polígono, São Paulo, 1970. 

2 Hoffman, K. e Kunze, R.; Álgebra Linear , Editora Polígono, São Paulo, 1971. 
3 Lipschutz, S.; Álgebra Linear ; McGraw-Hiíl do Brasil Ltda., Rio de Janeiro, 1971. 


ESPAÇO VETORIAL 


4.1 VETORES NO PLANO E NO ESPAÇO 

Imagine uma força atuando sobre um corpo. Você conseguirá precisá-la deter¬ 
minando sua intensidade e direção. Força é um exemplo típico de grandeza 
que será representada por um vetor. Outros exemplos são velocidade e deslo¬ 
camento. Neste capítulo desenvolveremos o conceito de vetor de uma forma 
bem ampla, de modo que, por exemplo, soluções de sistemas de equações li¬ 
neares ou de equações diferenciais também possam ser representadas por ve¬ 
tores. 
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4.1.1 Vetores no Plano 

Inicialmente, introduziremos a idéia de vetor, restringindo-nos ao plano. 
Para isto, consideremos o plano cartesiano que consiste de um sistema de 
coordenadas dado por um par de retas ortogonais, com orientação. Fixada 
uma unidade de comprimento, um ponto P do plano pode ser identificado 
com o par (a, b) de números reais, que são suas coordenadas. 


b 

- + p 

1 

i 

i 

i 

f 


a 


Figura 4.1.2 


Dados dois pontos P e Q do plano, podemos considerar o segmento de 
reta orientado PQ, com ponto inicial P e ponto Final Q . Note que embora co¬ 
mo conjunto de pontos os segmentos PQ e QP sejam iguais, como segmentos 
orientados eles são distintos. Diremos que eles são segmentos opostos. 

Vamos estabelecer que dois segmentos orientados são equivalentes se tive¬ 
rem o mesmo comprimento e direção. Por exemplo, na figura 



PQ , KL e RS têm a mesma direção; RT e KL têm o mesmo comprimento; PQ, 
—► —> 

RS e ZW têm o mesmo comprimento, mas os únicos segmentos com orienta- 
—^ ^ 

ções equivalentes são PQ e RS. Para qualquer segmento orientado no plano exis¬ 
te outro equivalente a este cujo ponto inicial é a origem. Por exemplo, 



Espaço Vetorial 99 



Figura 4.1,4 


Vamos passar a considerar agora, apenas os segmentos orientados com 
ponto inicial na origem, denominados vetores no plano . É importante notar que 
vetores no plano são determinados exclusivamente pelo seu ponto final, pois o 
ponto inicial é fixo na origem. Assim, para cada ponto do plano P(a f b ), está 
associado um único vetor v - OP e, reciprocamente, dado um vetor, associamos 
um único ponto do plano, que é o seu ponto iinal. Isto é, a correspondência 
entre pontos do plano e vetores é biunívoca. 

Usando esta correspondência entre vetores e pontos do plano, costumamos 

representar um vetor v — OP pelas coordenadas do seu ponto final P(a , b). 


Usamos a notação da matriz-coluna v = 


v - (ü, b). Por exemplo, v = 


ou v 


jj J, ou mesmo a identificação 
- (| n 3). Observe que, deste modo, 


à 


origem do plano ficará associado um vetor que tem os pontos inicial e final 
coincidentes com esta. Denominaremos tal vetor (que é só um ponto) de vetor 
nulo, e este será representado por (0, 0). 

O Oposto de um vetor v = OP é o vetor w = OQ , que tem o mesmo 
comprimento e direção oposta. Em termos de coordenadas, se v - (tf, b), então 
w = (-tf, -b) e, por essa razão, denotamos w = -v. 


4.1.2 Operações com Vetores no Plano 

a) Multiplicação de um vetor por um número. 

Multiplicar um vetor v por um número k > 0 é considerar um novo ve¬ 
tor w - k\, que possui a mesma direção de v e tem como comprimento k ve¬ 
zes o comprimento de v. Se k < 0, o vetor w = kv será igual ao oposto do 
vetor 1*1 • v. Se * = 0, w = k\ será o vetor nulo. 
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Figura 4.1.5 

Observe que a multiplicação de vetor por um número corresponde à multipli¬ 
cação da matriz-linha (ou coluna) por esse número. Assim, se v = (a, b) e 
w - kv, então w = (ka, kb). Por exemplo, para v = (2, -5), w - 3v = (6, -15). 

b) Adição de dois vetores. 

Para introduzir a soma de vetores, vamos voltar ao exemplo de forças 
atuando num corpo. Uma força que atua num ponto pode ser representada por 
um vetor, de comprimento igual à intensidade da força, com a mesma direção 
em que a força atua. (Estamos supondo que a origem do sistema de coordena¬ 
das está no ponto onde a força atua.) 

Suponhamos agora que temos duas forças Fj e F 2 atuando no mesmo 
objeto. Podemos representar o resultado destas duas forças por uma única for¬ 
ça R? Em outras palavras, o que é a '‘soma” de duas forças? 



A experiência mostra que a força resultante é representada pelo vetor diagonal 
do paralelogramo construído a partir dos vetores F, e F 2 . Chamamos a força 
resultante de soma de F 2 com F 2 e denotamos R = Fj + F 2 . Agora, pensemos 
em termos de coordenadas. Se F! = (a, b) e F 2 = (c, d ), quais são as coordena 
das de R? i 
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Usando congruência de triângulos, você pode notar que as coordenadas de R 
são (a + c, b + d). 

Foram resultados como este que motivaram a definição formal de soma 
de dois vetores no plano. Se v = (a, b) e w = (c, d ), então o vetor-soma será 
v + w = (a + c, b + d). Observe que somar vetores corresponde simplesmente a 
somar as matrizes que os representam. As operações entre vetores herdam, por¬ 
tanto, todas as propriedades das operações correspondentes para matrizes. 

Podemos ainda observar que a soma de um vetor v = (a, b) com seu 
oposto w = - v = (- a , -b) é o valor nulo. Isto é, v 4- w = v -f (-v) = (a - a, 
b - b) = (0, 0). 

Por diferença entre dois vetores v e w, entendemos a soma do primeiro 
com o oposto do segundo vetor, v - w = v + (-w). Isto é mostrado geometrica¬ 
mente, pela Figura 4.1.1. 



Figura 4.1.8 

4.1.3 Vetores no Espaço 

Da mesma forma que fizemos no plano, podemos considerar vetores no espaço. 
Teremos então um sistema de coordenadas dado por três retas orientadas, per¬ 
pendiculares duas a duas, e, uma vez fixada uma unidade de comprimento, cada 
ponto P do espaço estará identificado com a terna de número reais (x, y y z), 
que dá suas coordenadas. 




Figura 4.1.9 
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Também aqui os vetores são dados por segmentos orientados, com ponto 
inicial na origem, e existe uma correspondência biunívoca entre vetores e pon¬ 
tos do espaço que a cada vetor OP associa seu ponto final P - (tf, b, c). Deste 
modo, o vetor v = OP costuma ser denotado pelas coordenadas de P. 


Exemplo 



ou v = (tf, b } c) 



Figura 4.1.10 


A origem fixada para o espaço representará o vetor nulo (0, 0, 0). 

Assim, se chamarmos de V o conjunto de vetores no espaço, podemos 
identificar 

V = {(*,, x 2 , *,); Xj G R} 

= RXRXR=R 3 

4.1.4 Operações com Vetores no Espaço 

A soma de dois vetores e o produto de um vetor por um número (escalar) 
também são definidos da mesma forma que no plano 
Se u = (x u x 2 , x 3 ) e v = (y x , y 2 , y 3 ), 

u + v = (x, + y 1 , *2 + J2, *3 + T 3 ) 
e k u = (kx t , kx 2 , kx 3 ) 

Por exemplo, se u = (2, -3, 5) e v = (1, 2, 0), u + v = (3, -1, 5) e 
2u - (4, -6, 10). 

Como já observamos no caso do plano, estas operações correspondem exa¬ 
tamente às respectivas operações das matrizes-linha que representam os vetores 
e gozam de uma série de propriedades decorrentes daquelas relativas às ope¬ 
rações com números reais. 
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Propriedades: 

/) (u + v) + w = u + (v + w) 
tf) U + V = V + u 

iií) Existe 0 € V tal que u + 0 = u. (0 é chamado vetor nulo.) 
iV) Existe -u G V tal que u + (-u) = 0. 

v) a( u + v) = tfu + tfv 

vi) (tf + b)\ = tfv + b\ 

vii) (ab)\ = a(bv) 

V/tf) lu - u 

Estas propriedades servirão para caracterizar certos conjuntos que, apesar 
de terem natureza diferente dos vetores no espaço, “ comportam-se” como eles. 
Estes conjuntos receberão o nome de espaços vetoriais . 


4.2 ESPAÇOS VETORIAIS 

4.2.1 Definição: Um espaço vetorial real é um conjunto V, não vazio, 
com duas operações: soma, V X F—U V, e multiplicação por escalar, 

R X V —U F, tais que, para quaisquer u, v, w E F e tf, b G R, as proprieda¬ 
des de /) a viii) sejam satisfeitas. 

Se na definição acima, ao invés de termos como escalares, números reais, 
tive mios números complexos, F será um espaço vetorial complexo . 

Usaremos doravante a palavra vetor para designar um elemento de um 
espaço vetorial. Assim, por exemplo, se considerarmos o espaço vetorial 
V = M{ 2, 2), os vetores serão matrizes. (Mostre que M( 2, 2) realmente é um 
espaço vetorial, verificando as condições indicadas na definição 4.2.1. Lembre 
que os vetores u, v e w deste espaço vetorial são matrizes 2 X 2 e os escalares 
ainda números reais.) Agora, convém introduzir alguns exemplos de espaços 
vetoriais. 


4.2.2 Exemplos 

Exemplo 1: O conjunto dos vetores do espaço 

V = R 3 = {(*1, *2, JC 3 ); Xj G R} 

é evidentemente um espaço vetorial real (veja 4.1.3). 
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Exemplo 2: No lugar de ternas de números reais consideremos como ve¬ 
tores /z-uplas de números reais. 

v = R" = {(*!,*„ Xi e R} 

e se u = (*,, x 2 , x„), v = {>,, y 2 , .... y„) e a £ R, 

u + v = (x, + y u x 2 + 72 , .... x n + >-„) e au = («x,, ax 2 , ..., ax„) 

Neste caso perdemos, é claro, a visão geométrica de “vetores”, pois saímos de 
um espaço de “dimensão” 3 da geometria e passamos a um espaço de “dimen¬ 
são” n. Apesar disto, podemos trabalhar com estes espaços da mesma maneira 

que em R 3 . 

Subexemplo: n - 5; V = R s 

V = {*,, xj, x 3 , *4, *s): Xi € R} 

Se u = (1, 0, 2, -3, 4) 

e v = (0, 1, 1, -2, 5), 

então u - 2v = (1, 0, 2, -3, 4) - 2(0, 1, 1, -2, 5) 

= (1, 0, 2, -3, 4) - (0, 2, 2, -4, 10) 

= ( 1 , - 2 , 0 , 1 , - 6 ) 

Observe que, neste caso, o vetor nulo é (0, 0, 0, 0, 0). 

As n-uplas de números reais ou, equivalentemente, matrizes-linha 1 X n 
(ou matrizes-coluna n X 1) aparecem naturalmente na descrição de muitos pro¬ 
blemas que envolvem várias variáveis. Como um exemplo para determinar a po¬ 
sição de uma barra no espaço precisamos dar as coordenadas de suas duas 
extremidades A = («„ fl 2 , a 3 ) e B = (b lt b 2 , b 3 ). Assim, sua coordenada será 
dada por (a„ a 2 , a 3 , b u b 2 , b 3 ), e estaremos trabalhando com o espaço veto¬ 
rial R 6 . 

Exemplo 3: V = M(m, ri), o conjunto das matrizes reais m X n com a 
soma e produto por escalar usuais. 

Sub exemplos : 


Qual é o vetor nulo deste espaço vetorial? (Veja o Exercício 1 da secção 

4.8.) 

it) V = 4/(1, n) = {|aii 0i2 0ii ^ fí 

Observe que este espaço vetorial pode ser identificado com V = R (veja 

o Exemplo 2 desta seção). 
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Exemplo 4: V - P n , o conjunto dos polinómios com coeficientes reais, 
de grau menor ou igual a n (incluindo o zero). As operações são soma de po¬ 
linómios e multiplicação destes por números reais. 

Subexemplo : n = 2 
P 2 = {a 0 + a x x + a 2 x 2 : a; € R}. 

Todos os exemplos anteriores foram de espaços vetoriais reais. O próximo 
exemplo é de um espaço vetorial complexo. 

Exemplo 5: V é o conjunto das matrizes 2X2, cujos elementos são nú¬ 
meros complexos. As operações são adição de matrizes e multiplicação destas 
por números complexos. 

Exemplificando: 



Os espaços complexos aparecem, por exemplo, no estudo de sistemas de 
equações diferenciais. (Veja o Capitulo 12.) Salvo menção em contrário, todos 
os espaços vetoriais que abordaremos a seguir serão espaços vetoriais reais. 

4.3 SUBESPAÇOS VETORIAIS 

Às vezes, é necessário detectar, dentro de um espaço vetorial V, subconjuntos 
W que sejam eles próprios espaços vetoriais “menores”. Tais conjuntos serão 
chamados subespaços de F, Isto acontece, por exemplo, em: V = R 2 , o plano, 
onde W é uma reta deste plano, que passa pela origem. 



Figura 4.3.1 
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Veja que a reta W funciona sozinha como espaço vetorial pois, ao somarmos 
dois vetores de IV, obtemos um outro vetOT em W. Da mesma forma, se mul¬ 
tiplicarmos um vetor de W por um número, o vetor resultante ainda estará em 
W. Isto e', o subconjunto IV é “fechado” em relação à soma de vetores e à 
multiplicação destes por escalar. Estas são as condições exigidas para que um 
subconjunto W de um espaço vetorial V seja um subespaço. 

4.3.1 Definição: Dado um espaço vetorial V, um subconjunto IV, não va¬ 
zio, será um subespaço vetorial de V se: 

i) Para quaisquer u, v E JV tivermos u + v € W. 

ii ) Para quaisquer a £ R, n € IV tivermos <zu & W. 

Podemos fazer três observações: 

a) As condições da definição acima garantem que ao operarmos em W (soma 

e multiplicação por escalar), não obteremos um vetor fora de IV. Isto é 

suficiente para afimar que IV é ele próprio um espaço vetorial, pois assim 

as operações ficam bem definidas e, além disso, nao precisamos verificar 
as propriedades de (/) a (yiii) de espaço vetorial, porque elas são válidas 
em V, que contém IV. 

b) Qualquer subespaço IV de V precisa necessariamente conter o vetor nulo 

(por causa da condição (ii) quando a = 0). 

c) Todo espaço vetorial admite pelo menos dois subespaços (que sao chama¬ 
dos subespaços triviais), o conjunto formado somente pelo vetor nulo (ve¬ 
rifique (/) e (ii)) e o próprio espaço vetorial. 

4.3.2 Exemplos 

Exemplo 1 : V = R } e IV c_ V, um plano passando pela origem. 



Figura 4.3.2 

Veja geometricamente a validade de (i) e («).. Observe que se W não 
passasse pela origem, não seria um subespaço. Note que na verdade os úni¬ 



cos subespaços de R 3 são a origem, as retas e planos que passam pela ori¬ 
gem, e o próprio R 3 . 

Exemplo 2: V = R s e W = {(0, * 2 , * 3 , x s ); E R} 

Isto é, W é o conjunto dos vetores de R 5 , cuja primeira coordenada é nula. 
Verifiquemos as condições (?) e (ii). 

0 ü = (°> *2. *3, *4. *s), V = (0, y Jf y^ y 4t y 5 ) G W 

Então u + v = (0, x 2 + y 2 > x 3 + y 3> x 4 + y A , x s + y 5 ) que ainda 
pertence a W , pois tem a primeira coordenada nula. 
ii) ku = (0, kx 2 , kx 3 , kx Ay /:x s ) E W , pois a primeira coordenada é nula 
para todo k E R. 

Portanto, W é um subespaço vetorial de R 5 . 

Exemplo 3: V = M(n f n) e W é o subconjunto das matrizes triangula¬ 
res superiores. W é subespaço, pois a soma de matrizes triangulares superiores 
ainda é uma matriz triangular superior, assim como o produto de uma matriz 
triangular superior por um escalar. 

Exemplo 4: Uma situação importante em que aparece um subespaço é 
obtida ao resolvermos um sistema linear homogêneo. Por exemplo 

"2x + 4 y + z = 0 
< x + y + 2z = 0 
w x + 3y - z=0 

Observe que, se colocarmos este sistema na forma matricial, teremos 


2 4 1 


- - 

X 


0 

1 1 2 


y 

- 

0 

1 3 -1 


z 


0 


Desta forma, estamos procurando, dentro do espaço vetorial M( 3, 1) 
<&s matrizes-coluna de 3 linhas, aqueles vetores que satisfazem a relação (*), 
ttto é, aqueles vetores-solução do sistema. Queremos saber se o conjunto dos 
vetores-solução é um subespaço de M( 3, 1). Para isto, teremos que tomar 
dois vetores-solução. 


*1 

y\ 

e 

*2 

y 2 

, e verificar se sua soma 

y i 

+ 

*2 
y 2 



*2 


Zi 


*2 
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ainda é um vetor-soluçao. Então 



Isto é, a soma é Solução. Além disso, se multiplicarmos 
tante k , teremos 



por uma cons¬ 



isto é, o produto de uma constante por uma solução ainda é uma solução. Por¬ 
tanto, o conjunto IV dos vetores-solução de (*) é um subespaço de M( 3, 1). 
(Considerando a identificação M = (3, 1), como R 3 , W pode ser dado geometri¬ 
camente pela intersecção dos três planos no espaço descritos por cada uma das 
equações de (*)•) 


Exemplo 5 : 0 conjunto-solução de um sistema linear homogêneo de n 
incógnitas é um subespaço vetorial d1). Tente provar isto. 

Alguns exemplos em que W não é subespaço de V são os seguintes. 


Exemplo 6: V = R 2 , onde W é uma reta deste plano que não passa pela 
origem. 



Figura 4.3.3 
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B mo é subespaço de V , pois existem u e v em W, tal que u + v Ú W. Outra 
maneira de ver que W não é subespaço de V é notar que o vetor nulo não 
pertence a W. (Veja a observação b em 4.3.1.) 

Este ultimo fato e usado frequentemente para determinarmos que U C V 
nao é subespaço de V, isto é, sempre que 0 4 U, podemos afirmar que U não é 
subespaço de V. Mas, cuidado: Não vale a recíproca, pois podemos ter 0 £ U 
sem que U seja subespaço, como mostra o exemplo seguinte. 

Exemplo 7: V - R 2 e W = {(*, x 2 ); * e R}. Se escolhermos u = (1 1) e 
v = (2, 4), temos u + v = (3, 5) g W. Assim, W não é subespaço vetorial de V 
pois, caso contrário, a condição (/) deveria ser satisfeita para quaisquer u e v E 
€ IV, e isto não ocorre neste exemplo. 



(o 7 o) e w 


Figura 4.3.4 

Exemplo 8: V = M(n, n) e W é o subconjunto de todas as matrizes em 
que <0. Mostre que a condição (i) é satisfeita, mas (ii) não é; portanto, 

W não é um subespaço. 

Exemplo 9: Se um sistema linear não for homogêneo, o que acontece 
com seu conjunto-solução? Considere o exemplo: 

r 

2x + 4y + z - 1 
(■') 4 x + y + 2z = i 
x + 3y - 7=0 

Prove que a soma de dois vetores-solução nem sempre é um vetor-solução, e 
assim o conjunto-solução não é um subespaço de A/(3, 1). (Veja o Exercício 
17 da secção 4.8.) 

Embora nos Exemplos 6 e 9, IV não seja subespaço, ainda assim ele é um 
subconjunto especial que recebe o nome de variedade linear . Estudaremos me¬ 
lhor este tipo de subconjunto em 4.9. O Exemplo 7 não é uma variedade linear. 
Agora veremos as principais propriedades dos subespaços. 
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4.3.3 Teorema: (Intersecção de subespaços): Dados e W 2 subespaços 
de um espaço vetorial V, a intersecção IV, O IV 2 ainda é um subespaço de V. 
Prova: Observamos inicialmente que W x D W 2 nunca é vazio pois ambos os 
subespaços contêm o vetor nulo de V. Ê necessário verificar então as condiçoes 
i) e «) para mostrar que W x n Hs também é subespaço vetorial de V. 

i) Dados x, y e W, n Wj, x e y pertencem a W x , e também a W 3 . Então, 
x + yGlV, e x + y € W 2 , sendo e R' 2 subespaços de V. Portanto, 
x + y £ IVj H W 2 • 

ii) Agora, você deverá provar a segunda condição como um exercício. 

4.3.4 Exemplos 

Exemplo 1: V - R 3 

W x n W 2 é a reta de interseção dos planos W t e W 2 . 



Figura 4.3.5 


Exemplo 2: V - M(n , n) 

W x - {matrizes triangulares superiores} 

W 2 = {matrizes triangulares inferiores} 

Então Wi H W 2 = (matrizes diagonais}. 

Uma vez que a interseção de dois subespaços ainda é um subespaço veto¬ 
rial, poderíamos esperar o mesmo da reunião. Mas isto não acontece, como po¬ 
demos ver no próximo exemplo. 

Exemplo 3: V = R 3 



Figura 4.3.6 
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W x e W 2 são retas que passam pela origem. Então, W x n W 2 - { 0 } e U W 2 
é o “feixe” formado pelas duas retas, que não é subespaço vetorial de R 3 . De 
fato, se somarmos os dois vetores u e v, pertencentes a W l U W 2 , vemos que 
u + v está no plano que contém IV j e W 2 mas u + v £ W x U W 2 . 

Assim, W x U W 2 não é subespaço de V. Entretanto, podemos construir 
um conjunto IV, que contém W x e W 2 e é subespaço de V. W será formado 
por todos os vetores de V que forem a soma de vetores de W x com vetores de 
W 2 . W = W x + W 2 será chamado “soma de W x e IV 2 ”. Será conveniente colocar¬ 
mos esta afirmação de forma mais precisa. 


4.3.5 Teorema: (Soma de subespaços): Sejam W x e W 2 subespaços de um 
espaço vetorial V. Então, o conjunto 

IV, + W 2 = {v £ V\ v = w, + w 2 , w, £ IV, e w 2 £ W 2 } é subespaço de V. 

Prova : (Veja o Exercício 23 da secção 4.8.) 

4.3.6 Exemplos 

Exemplo 4: No exemplo anterior, IV = IV, 4- JV 2 é o plano que contém 
as duas retas. 

w 2 

Figura 4.37 

Exemplo 5 : Se IV, C R 3 é um plano e W 2 é uma reta contida neste pla¬ 
no, ambos passando pela origem, IV, + W 2 = IV i 


w x + w 2 = w x 
w 2 

Figura 4.3.8 
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Exemplo 6: 


*"-{[;x]} •*•{[* 3 }- 

Então W x + W 2 = j^jj, 2)' 


onde a t b, c, d E R. 


Quando W x nW 2 = {0}, então W x + W 2 ê chamado soma direta de W x 
com W 2 , denotado por W x © W 2 > Os Exemplos 4 e 6 são exemplos de soma 
direta, e um contra-exemplo é dado no Exemplo 5. Observe que tanto no Exem¬ 
plo 1, como no 2, temos que o espaço todo V- W x + W 2% mas a soma não é 
direta. 


4.4 COMBINAÇÃO LINEAR 

Vamos comentar, agora, uma das características mais importantes de um espaço 
vetorial, que é a obtenção de novos vetores a partir de vetores dados. 

4 .4.1 Definição: Sejam V um espaço vetorial real (ou complexo), 

Vi, v 2 , v n G V e a x , ..., a n números reais (ou complexos). Então, o vetor 

v = a x y x + a 2 y 2 + ... + a n \ n 

é um elemento de V ao que chamamos combinação linear de v l9 v rt . 

Uma vez fixados vetores v l9 \ n em V, o conjunto W de todos os ve¬ 
tores de V que são combinação linear destes, é um subespaço vetorial. (Mostre 
isto como exercício.) W é chamado subespaço gerado por v l9 \ n e usamos a 
notação 

w = [v,, V„] 

Note que, formalmente, podemos escrever 

W = [vj, ..., v n ] = {v G V\ v = a x v x + ... + a n \ n , tf; £ R, 1 < i < n] 


Uma outra caracterização de subespaço gerado é a seguinte: W - [v 1 ,...,v n ] 
é o menor subespaço de V que contém o conjunto de vetores {v l9 v*}, no senti¬ 
do de que qualquer outro subespaço W de V que contenha {v l9 v,J satis¬ 
fará W D W. (Mostre também esta afirmação como exercício.) 

4.4.2 Exemplos 

Exemplo 1: V = R 3 , v G V, v 4= 0. 

Então [v] = (tfv: a G R}, isto é, [v] é a reta que contém o vetor v. 
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Figura 4.4.1 

Exemplo 2: Se v ls v 2 G R 3 são tais que a\ y ^ v 2 para todo a G R, então 
[vi, v 2 ] será o plano que passa pela origem e contém v, e v 2 . 



Figura 4.4.2 

Observe que se v 3 € lv,, v 2 ], então lv,, v 2 , v 3 ] = [v,, v 2 ], pois todo vetor que 



Figura 4.4.3 

pode ser escrito como combinação linear de Vj, v 2 , v 3 é uma combinação linear 
apenas de e v 2 (pois v 3 é combinação linear de v x e v 2 ). 

Exemplo 3: V =R 2 ,\ X =- (1, 0), v 2 = (0, 1). Logo V = [v l5 v 2 ] pois, da¬ 
do v = (x, y) G V, temos (x, y) = *(1, 0) + y( 0, 1), ou seja, v = xv x + yv 2 . 

Exemplo 4: 


v, = 


1 0 
0 0 




0 1 
0 0 


Então [vj, v 2 ] = 



tf b 

0 0 

: a, b e R 

L 


j 
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4.5 DEPENDÊNCIA E INDEPENDÊNCIA LINEAR 

Em Álgebra Linear, é fundamental sabermos se um vetor é uma combinação li¬ 
near de outros. No Exemplo 2 da seção anterior, o espaço gerado por Vi, v 2 , 
Vjéo mesmo que o espaço gerado por v,, v 2 . A razão disso é que v 3 é um 
vetor “supérfluo” para descrever o subespaço, pois é uma combinação linear de 
Vj e v 2 . No caso geral, dados os vetores v 1( v 2 , v„, queremos saber se não 

existem vetores “supérfluos”, isto é, se algum desses vetores não é uma combi¬ 
nação linear dos outros. Para chegarmos a uma conclusão, precisamos começar 
definindo dependência e independência linear. 

4.5.1 Definição: Sejam V um espaço vetorial e v,, ..., v„ G V. Dizemos 
que o conjunto {v,, ..., v„} é linearmente independente (LI), ou que os vetores 
v,, ..., v„ são LI, se a equação 

a,v, + ... + a„v„ = 0 

implica que a, = a 2 = ... = a„ = 0. No caso em que exista algum a,- ¥= 0 dize¬ 
mos que {v,, ..., v„} é linearmente dependente (LD), ou que os vetores 
Vi, v„ são LD. 

Vetores linearmente dependentes podem ser caracterizados de uma outra 
maneira. 

4.5.2 Teorema: (v,.v„) é LD se, e somente se um destes vetores for 

uma combinação linear dos outros. 


Prova: 

Sejam Vj, ..., v„ LD e 

a^! + ... + ajVj + ... + o„v„ = 0 

Segundo a definição dada, um dos coeficientes deve ser diferente de zero. Su¬ 
ponhamos que a/ & 0. Então 


v/ = - — (aiV! + ... + ay.jv/.j + a /+) v /+1 + ... + a„v„) 


e portanto 


Vj = -fi Vi + ... ~ v„ 
1 «/ a i 


Logo, vy é uma combinação linear dos outros vetores. 

Por outro lado, se tivermos {v 1? ..., vy, v*} tal que para algum;, 

Vj = *,v, + ... + + + - - b„v„ 
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temos 

^iVj + ... - í \j + ... + b n v n = 0 com bj = -1 e, 
portanto, {v 1? v„} é LD. 


Esta proposição também é equivalente a: Um conjunto de vetores é LI 
se, e somente se nenhum deles for uma combinação linear dos outros. 


4.5.3 Exemplos 

Exemplo 1: V = R 3 . Sejam Vj, v 2 € V. 

( v i> v 2 } é LD se e somente se v { e v 2 estiverem na mesma reta, que passa pe¬ 
la origem. (vj = \v 2 ). Veja a Figura 4.5.1. 



Figura 4.5.1 


Exemplo 2: V = R 3 . Sejam Vj, v 2) v 3 E V. 

{vi, v 2 , v 3 } é LD se estes três vetores estiverem no mesmo plano, que passa 
pela origem. Veja a Figura 4.5.2. 



Figura 4.5.2 


Exemplo 3: V = R 2 , = (1, 0) e e 2 = (0, 1). 

ej e e 2 são LI, pois 

Ü\Z\ + 02 e 2 - 0 

fl,(1, 0) + « 2 (0, 1) = (0, 0) 

(«,. a 2 ) = (0, 0) 

a x = 0 e a 2 = 0 
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Exemplo 4: De modo análogo, vemos que para V = R 3 , e, = (1, 0, 0), 
e 2 - (0, 1, 0) e e 3 = (0, 0, 1). Então e lf e 2 e e 3 são LI. 

Exemplo 5: V - R 2 

{(1 > -1), (1> 0), (1, 1)} é LD, pois T (l, -1) - 1(1, 0) + y(l, 1) = (0, 0). 

4.6 BASE DE UM ESPAÇO VETORIAL 

Agora, estamos interessados em encontrar, dentro de um espaço vetorial F, 
um conjunto finito de vetores, tais que qualquer outro vetor de F seja uma 
combinação linear deles. Em outras palavras, queremos determinar um conjun¬ 
to de vetores que gere V e tal que todos os elementos sejam realmente ne¬ 
cessários para gerar V. Se pudermos encontrar tais vetores, teremos os alicerces 
de nosso espaço, com estes vetores fazendo o mesmo papel que i, j, k na Geo¬ 
metria Analítica no espaço. Denominaremos um conjunto de vetores desse tipo 
de base. 

4.6.1 Definição: Um conjunto (v l5 v„} de vetores de V será uma ba¬ 
se de Fse: 

0 {v,, V„} é LI 
H) (V), v„] = V 

4.6.2 Exemplos 

Exemplo 1: V - R 2 , ej = (1, 0) e e 2 = (0, 1) 

\c l , e 2 } ê base de F, conhecida como base canônica de R 2 . (Veja o Exemplo 
3 da seção 4.4.2 e o Exemplo 3 da seção 4.5.3.) 

O conjunto {(1, 1), (0, 1)} também ê uma base de V = R 2 . De fato: 

Se (0, 0) =- a( 1, 1) + b( 0, 1) = («, a + b ), então a = b = 0. Isto é, {(1, 1), 

(0, 1)} é LI. 

Ainda 1(1, 1), (0, 1)] - V pois dado v = (x, y) E F, temos 
(x, y) = x(U 1) + C y ~ x)(0, 1) 

ou seja, todo vetor de R 2 é uma combinação linear dos vetores (1, 1) e (0, 1). 
Veja a Figura 4.6.1. 



Figura 4.6.1 
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Exemplo 2 : 

{(0, 1), (0, 2)} não é base de R 2 , pois é um conjunto LD. 

Se (0, 0) = a(0, 1) + í>(0, 2), temos a = -2b e a e b não são necessariamente 
zero. Veja a Figura 4.6.2. 


( 0 , 2 ) 
( 0 , 1 ) 


Figura 4.6.2 


Exemplo 3\ V = R 3 

{(1, 0, 0), (0, 1, 0), (0, 0, 1)} é uma base de R 3 . Esta é a base canônica de 
R 3 . Podemos mostrar que 

0 { e i> e 2 , e s} é LI e 
ü) (*, y, z) = xe, + >e 2 + ze 3 


I i 

r: 

r 

i. 


Exemplo 4: 

{(1, 0, 0), (0, 1, 0)} não é base de R 3 . É LI, mas não gera todo R 3 , isto é, 
1(1, 0, 0), (0, 1, 0)] *R 3 . 


Exemplo 5: V = M( 2, 2) 


1 o" 1 


0 1 


0 0 


0 0 

0 0 

i 

0 0 


1 0 

* 

0 1 


é uma base de F. 



(Veja o Exercício 9 da secção 4.8.) 

Existem espaços que não têm base finita. Isto acontece principalmente 
quando trabalhamos com espaços de funções. Nestes casos, precisaremos de um 
conjunto infinito de vetores para gerar o espaço. Isto não quer dizer que esta¬ 
mos trabalhando com combinações lineares infinitas, mas sim, que cada vetor 
do espaço é uma combinação linear finita daquela base infinita”. Ou seja, pa¬ 
ra cada vetor, podemos escolher uma quantidade 1 inita de vetores da “base” 
para, com eles, escrever o vetor dado (veja o Exercício 16 da secção 4.8,). Nes¬ 
te texto, consideraremos sempre espaços vetoriais que tenham uma base finita. 

Para obter propriedades acerca das bases de um espaço, consideremos as 
proposições seguintes. 
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4.6.3 Teorema: Sejam Vj, v 2 , ..., v„ vetores não nulos que geram um es¬ 
paço vetorial V. Então, dentre estes vetores podemos extrair uma base de V. 


Prova: Se Vj, v 2 , v„ são linearmente independentes, então eles cumprem as 
condições para uma base, e não temos mais nada a fazer. Se v 1} v 2 , v„ são 
linearmente dependentes, então existe uma combinação linear deles, com algum 
coeficiente não zero, dando o vetor nulo 

*lVi + *2*2 + ■** + = 0 


Seja, por exemplo, x n # 0. Então podemos escrever 


v„ = 


-Xi 


Vi + 


-*2 


V 2 




Vn -1 


ou seja, v„ é uma combinação linear de v,, v„_, e, portanto, v,, v 2 , v„_, 

ainda geram V. Se v,.v M _, for LD, então existe uma combinação linear de.- 

les dando o vetor nulo e com algum coeficiente diferente de zero; portanto, 
poderemos extrair aquele vetor que corresponde a este coeficiente. Seguindo 
desta forma, após uma quantidade finita de estágios, chegaremos a um subcon¬ 
junto de {v 1( v„}, formado por r{r < rí) vetores LI v,-,, v (2 , ..., v,>, que 

ainda geram V, ou seja, formaremos uma base. 


4.6.4 Teorema: Seja um espaço vetorial V gerado por um conjunto finito 
de vetores v,, v 2 , ..., v„. Então, qualquer conjunto com mais de n vetores é 
necessariamente LD (e, portanto, qualquer conjunto LI tem no máximo n veto¬ 
res). 

Prova-. Como K, ..., v„] = V, pela proposição anterior, podemos extrair uma 
base para V de v„ ..., v„. Seja v,, ..., v r , r < n, esta base (para não complicar 
a notação). Consideremos agora w 1( w 2 , ..., w m , m vetores de V, com m > n. 
Existem, então, constantes a,y, tais que 


(1) 

Wi = ÜuVj + 0 12 v 2 + . 
w 2 = 0 21 Vj + 0 22 V 2 + . 

.. + a ir v r 

.. + a 2r V r 


w m = a mi v i + a m 2 y 2 + • 

• • + a mr y r 

Consideremos agora uma 

combinação linear de Wj 

, .... W OT , 

(2) 

0 = XiW( + x 2 w 2 + ... 

+ *m w m 


dando zero. 



Substituindo as relações (1) em (2) e coletando os termos, obtemos 

0 = (a n x, + a 2l x 2 + ... + a ml JC m )v, + 

+ (a 12 x, + a 22 x 2 + ... + a m2 x m )\ 2 + ... 

+ (« lr JC, + a 2r x 2 + ... + a mr x m )v r . 

Como Vi, v 2 , ..., \ r são LI, então 

011*1 + 021*2 + - + a mi x m = 0 

- 

a \ r x 1 + a 2 r x 2 + - + “ mr x r =. 0 

Temos então um sistema linear homogêneo com r equações e m incógnitas 

X\ y ..., x m e, como r < n < m, ele admite uma solução não trivial, ou seja, 

existe uma solução com algum Xj não nulo. Portanto w b são LD. 

4.6.5 Corolário: Qualquer base de um espaço vetorial tem sempre o mes¬ 
mo número de elementos. Este número é chamado dimensão de F, e denotado 
dim V. 

Prova: Sejam {v u v„} e {w t , ..., w m } duas base de V. Como v h .„, v„ 
geram F e w h ..., w m são LI, pela proposição anterior, m < n. 

Por outro lado, como w l2 ..., w m geram F e v ls .... \ n são LI, ainda pe¬ 
lo teorema anterior, n < m. Portanto, n = m. 


4.6.6 Exemplos 

Exemplo 1: V - R 2 

{(1, 0), (0, 1)} e {(1, 1), (0, 1)} são bases de V. Então dim V - 2. 

Exemplo 2: dim R 3 = 3. 

Exemplo 3: V - M( 2, 2). 

Como vimos no Exemplo 5 da seção 4.6.2, uma base tem 4 elementos. Então 
dim F = 4. 

Quando um espaço vetorial F admite uma base finita, dizemos que V é 
um espaço vetorial de dimensão finita. 


4.6.7 Teorema: Qualquer conjunto de vetores LI de um espaço vetorial V 
de dimensão finita pode ser completado de modo a formar uma base de V 

Prova: Seja dim F = n e v u v r vetores LI. (Observe que, pelo teorema 
4.6.4, a* < «.) Se [vj, v r ] = K, então {v u ..., v r } forma uma base, e não 
temos mais nada a fazer (neste caso, n = r). 
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Se existe v r+1 € F tal que v r+1 6 lv t , .... v r ], isto é, v r+1 não é uma 
combinação linear de v h v r , então {\ u v 2 , ..., v r , v r+1 ) é LI (prove isto!). 
Se [v 1? v 2 , v n v r+1 ] = F, então {v,, v r+1 } é a base procurada. Caso con¬ 

trário, existe v r+2 4 l v ii v r + J então, {vj, v r+1 , v r+2 } é LI (prove 
isto!). Se [v 1? ..., \ r+]y v r+2 ] nossa prova está concluída. Se não, prosseguimos 
usando o mesmo argumento. Como não podemos ter mais do que n vetores LI 
em F (veja o teorema 4.6.4), após um número finito de passos teremos obti¬ 
do uma base de F que contém os vetores dados. 

Um corolário muito aplicado desta proposição é 

4.6.8 Corolário: Se dim V - n, qualquer conjunto de n vetores LI forma¬ 
rá uma base de F. 

Prova : Se não formasse uma base, poderiamos completar o conjunto até formá- 
-la e dessa forma teríamos uma base com mais do que n vetores em F, o que 
é absurdo (veja 4.6.5). 

Por exemplo, se você souber que a dim V - 2, e encontrar um conjunto 
de dois vetores LI, você pode afirmar que ele é uma base e portanto gera F. 

Uma proposição que relaciona as dimensões de subespaços de um espaço 
vetorial é dada a seguir. 

4.6.9 Teorema: Se U e W são subespaços de um espaço vetorial V que 
tem dimensão finita, então dim U ^ dim F e dim W ^ dim V. Além disso, 

dim (U + W) = dim U + dim W - dim(í/ n W) 

A demonstração desta proposição é feita tomando-se bases para U e W, juntan¬ 
do-as, obtendo um conjunto de vetores que gera U + W e depois estudando 
quantos são necessários extrair para se obter uma base para U + HO Deixamos 
você fazer esta prova, recomendando que resolva primeiro os problemas 27 e 
28 da secção 4.8. É um bom exercício ! 

O resultado a seguir nos permitirá falar em coordenadas de um vetor. 

4.6.10 Teorema: Dada uma base 0 = {v ly v 2 , v„) de F, cada vetor de 

V é escrito de maneira única como combinação linear de v ly v 2 , v„. 

Prova : De fato v €E F, v = ajVj + ... + a n v n pois [v ly v„] = F, e co¬ 
mo, {vj, ..., v„} é LI, os a u ..., a n são univocamente de termina dos. (Ve ri fique!) 
Estamos supondo aqui que foi fixada uma ordem para os elementos da base. 
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4.6.11 Definição: Sejam 0 = {v u v„} base de F e v € F onde 
v = a,vi + ... + a„v n . Chamamos estes números a u ..., a n de coordenadas de v 
em relação à base 0 e denotamos por 

~*i 

M0 = : 

Exemplo: V = R 2 
0 = {(1,0), (0, 1)} 

(4, 3) = 4(1, 0) + 3(0, 1). 


Portanto [(4, 3)]p = ^ 3 J 

Se 0' = \(1, 1), (0, 1)}, então (4, 3) = *(1, 1) + y(0, 1), resultando r = 4e 

y = -i. 

Então ( 4 , 3) = 4(1, 1) - 1(0, 1), donde [(4, 3)]^ = 

Observação : É importante notar que a ordem dos elementos de uma base tam¬ 
bém influi na matriz das coordenadas de um vetor em relação a esta base. Por 
exemplo, se tivermos: 

(3, = {(1, 0), (0, 1)} e 0 2 = {(0, O, (1, 0)}, 

então 

U4, 3)1(3, = 3 

Em virtude disto, doravante, ao considerarmos uma base 0 = (v,, v 2 ,..., v„}, 
estaremos sempre subentendendo que a base seja ordenada, isto é, que os veto¬ 
res estão ordenados na ordem em que aparecem. Outras situações onde a ordem 
dos vetores é de suína importância são apresentados em 4.7 e nos Capítulos 
5e 10. 




4.6.12 Exemplo 

Considere: 

V = {(x, y, z) \ x + y - z = Q] 
W = {(x, y, z) ; x = y }. 
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Deteimine V + W. 

Observe que 

v = [(1,0, 0,(0, í. D] 

w = [(1, í, o), (0, o, D] 

Então x 

V+W= [( 1 , 0 , 1 ), ( 0 , 1 , 1 ) , ( 1 , 1 , 0 ) , ( 0 , 0 , 1 )] 

(Veja 4.6.9.) 

Como, dado (x,y, z ) e R 3 podemos escrever 

(x,y,z) = a(l, 0, 1) + 0(0, 1, 1) + 7(1, 1, 0) + 5(0, 0, 1) 

Com 


a = x 

Observe que a solução deste 

p=y 

sistema não è única uma 

7 = 0 

vez que 4 vetores no R 3 é 

5 = z-x -y 

necessariamente LD. 


Portanto K + W = R 3 . 

Usando 4.6.9, 

dim R 3 = dim V + dim W - dim (V n W) 
temos que dim (V n W) = 1 
Vamos determinar V n W. 

VnW = {(x,y, z) ;x + y - z = 0 e x = y } 
= {(*.;'» z) -,x = y = zl 2} 

= [( 1 . 1 , 1 / 2)1 

(Confira com o Exercício 25.) 



Para concluir esta secção gostaríamos de recomendar mais fortemente 
alguns exercícios. Os espaços vetoriais mais usados na prática são os R n e seus 
subespaços e, por isso, é bom saber obter suas bases de modo rápido: Um pro¬ 
cesso para tal fim é delineado nos Exercícios 17 e 18 da secção 4.8. 

Volte ao Exemplo 4 da seção 4.3.2. Se quisermos explicitar o espaço-so¬ 
lução, teremos que resolver o sistema. Fazendo isto, verificamos que o espaço- 
-solução é o espaço gerado por 
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e, portanto, é um subespaço de dimensão 1. Observe ainda que o grau de li¬ 
berdade do sistema é 1. Faça o Exercício 216 e c da secção 4.8. 


4.7 MUDANÇA DE BASE 

Você já deve ter visto uma situação em que a resolução de um problema de 
Física (de cinemática ou estática, por exemplo) torna-se muito mais simples se 
for escolhido um referencial conveniente para descrever o movimento. Por exem¬ 
plo, num problema em que um corpo se move no plano xy 9 cuja trajetória é uma 
elipse de equação x 2 + xy + y 2 - 3 = 0 (veja a Figura 4.7.1), a descrição do 
movimento torna-se muito simplificada se ao invés de trabalharmos com os 
eixos x e y (isto é, o referencial determinado pela base formada por i e j ), 
utilizamos um referencial que se apóia nos eixos principais da elipse. 



Figura 4.7.1 

Neste novo referencial, a equação da trajetória será mais simples: 

3x\ + 2y\ = 6 

(Depois você verá, no Capítulo 11, como foi encontrada esta equação.) 

Numa situação desse tipo, temos duas questões a resolver: 

1) Como escolher o novo referencial? 

2) Uma vez escolhido, qual a relação entre as coordenadas de um ponto 
no antigo referencial e suas coordenadas no novo? 
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A primeira questão é mais delicada e será estudada no Capitulo 11. Agora, 
veremos como solucionar a segunda. Passando a um contexto mais amplo, esta¬ 
mos interessados na seguinte situação. 

4.7.1 Sejam 0 = {u, ( ..., u„} e 0' = {w,, .... w„} duas bases ordenadas 
de um mesmo espaço vetorial V. Dado um vetor v £1 V. podemos escrevê-lo 


e (§) 


V = JKjU, + ... + X„U„ 


V ' v = yjW, + ... + 

Como podemos relacionar as coordenadas de v em relação à base 0, 


com as coordenadas do mesmo vetor v em relação à base 0 , 


Np' - 


Já que {u,, ..., u„} é base de V, podemos escrever os vetores w, como combi- 
nação linear dos uy, isto é, 

Wi = a11 U] + ^2i u 2 + ■■■ + a n\ u n 
W 2 = 6?i2 U 1 + ^22^2 + — + a rt 2 u n 

(§§) \ : : i : 

w„ - a ln u l + a 2 rt u 2 + ... + a nn u n 

Substituindo em (§) temos: 

v = 7 jW! + ... + y„ w„ 

= Ji( a n u i + ■■■ + a m ü n) + — + J’«( a i« u i + + a nn u n ) 

= (aiiJi + ... + ainyn)u\ + ... + Oni>'l + ■■■ + a nn>'n) u n 


Mas v = x x Ui + ... + x n u n , e como as coordenadas em relação a uma base são 
únicas, temos: 

*1 = + fl i2/2 + ••• + a l nyn 


*n = a n\y\ + a myi + ••• + a nnyn 
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Em forma matricial 



Isto é, denotando 



temos 




M/3' 

A matriz [lÍ^ é chamada matriz de mudança da base $' para a base 0. 

Compare 1 'Ç com {§§) e observe que esta matriz é obtida, colocando as 
coordenadas em relação a d de w, na i-ésima coluna. Note que uma vez obtida 
[/]P podemos encontrar as coordenadas de qualquer vetor v em relação à base 0 , 

multiplicando a matriz pelas coordenadas de v na base 0' (supostamente conhe- 
cidas). 

O exemplo a seguir esclarece melhor o papel da matriz de mudança de 

base. 


Exemplo : Sejam |3 = {(2, -1), (3, 4)} e 0 - {(1, 0), (0, 1)} bases 

de R 2 . Procuremos, inicialmente, [/]^ . 

Wi = (1, 0) = 0n(2, 1) + a 2i(3, 4) 

donde (1,0) = ( 2 a u + 3a 2 i,-^i\ + 4a 2 i)- 

4 _ J_ 

Isto implica que a n - — e a 2 \ - ^ \ * 

W 2 ~ (0, 1) = a l2 (^» '0 ^ a 22 (3, 4) 


Resolvendo, a n 


TT e “» ‘ 


2 

TT 
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Portanto, 


_4_ 

11 11 

jl 

ii ii 


Podemos usar esta matriz para encontrar, por exemplo, [v]^ para v = (5, -8). 
[(5, -8)fc = [(5, -8)fc' 


_4_ ^3_ 

11 11 5 

J_ 2_ -8 

11 11 


“ A 


Isto é, 


(5, -8) = 4(2, -1) - 1(3, 4) 


É claro que se o nosso problema fosse só encontrar as coordenadas de (5, -8), 
em relação à base 0, poderiamos simplesmente resolver o sistema 

(5, -8) = a{ 2, -1) + b( 3, 4). 

O cálculo feito através da matriz de mudança de base é operacionalmente van¬ 
tajoso quando trabalharmos com mais vetores, pois neste caso não teremos que 
resolver um sistema de equações para cada vetor. 

4.7.2 A Inversa da Matriz de Mudança de Base: Se em 4.7.1 começarmos 
escrevendo os u, em função dos w ; , chegaremos à relação: 

Mp' = [tf# [v](3 

Um fato importante é que as matrizes [/]»» e [/]jj são inversíveis e 

(wJV 1 = [/$ 

Veja o Exercício 34 da secção 4.8. 

4.7.3 Exemplos 

Exemplo 1: No exemplo anterior podemos obter L/É a partir de 
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Note que [/jj^ é fácil de ser calculada, pois ^ é a base canônica. 

( 2 , - 1 ) = 2 ( 1 , 0 ) - 1 ( 0 , 1 ) 

(3, 4) = 3(1, 0) + 4(0, 1) 

donde 




Exemplo 2 : Consideremos em R 2 a base 0 = {e,, e 2 } e a base 
0 ' = {fj, f 2 }, obtida da base canônica 0 pela rotação de um ângulo 0. Dado 
um vetor v G R 2 de coordenadas 



em relação à base 0, quais sao as coordenadas 



em relação à base 0 ? Temos então 



Figura 4.7.2 


V XiCi + x 2 e 2 

= y ifi + yih 


e queremos calcular 




ou seja, temos que achar a matriz UÚ'. Para isto, devemos escrever e, e e, em 
função de f, e f 2 . Veja as Figuras 4.7.3 e 4.7.4. Biblioteca d 
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ou seja, yi = Xi cos 0 + x 2 sen 0 
y 2 = -x j sen 6 + x 2 cos 0 

Como subexemplo, quando 0 = y, para v = (-2, 3), isto é 
v - -2e! + 3e 2 , temos [v]^ = 


(-2, 3) 



I e, 

Figura 4.7.5 



e queremos determinar as coordenadas de v na base 0' - {f], f 2 }. 
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Como vimos, [v]^ = 
onde y\ = x { cos 6 + x 2 sen 6 = -2 cos — + 3 sen y 

y 2 = -Xi sen 6 + x 2 cos 6 - 2 sen y + 3 cos y 




ou seja, 


-2 + 3>/3 


3 + 2>/3 
2 , 


4.8 EXERCÍCIOS 

1 . a) Seja V o espaço vetorial R", definido no Exemplo 2 de 4.2.2. Qual é o 

vetor nulo de V e o que é ~(x\, x 2 , ..., x n )1 b) Seja W = M(2, 2) (veja 
4.2.2 Exemplo 3 /)) descreva o vetor nulo e vetor oposto. 

2. Mostre que os seguintes subconjuntos de R 4 são subespaços 

a) W = {(x, y, z, t) e R 4 ix +7 = 0ez-/ = °} 

b) U = {(x, y, z, t) e R 4 i 2* + >- - t = 0 e z = 0} 

3. Responda se os subconjuntos abaixo são subespaços de M(2, 2). Em caso 
afirmativo exiba geradores 

a) V = ^J com a, b, c, d € R e b - c 

b) w Q com a, b, c, d & R e ò = c + 1 j* 

4. Considere dois vetores (a, b ) e (c, íf) no plano. Se ad - bc - 0, mostre que 
eles são LD. Se ad - bc * 0, mostre que eles são LI. 

5 . Verifique se os conjuntos abaixo são espaço vetoriais reais, com as opera¬ 
ções usuais. No caso afirmativo, exiba uma base e dê a dimensão. 

a) Matrizes diagonais n X n 

b) Matrizes escalares n X n 
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‘>{£ V}** 611 } 

d) V = {(a, a, .... a) E R n : a E R} 

e) {(1, a, b)\ a, b E R} 

f) A reta {(a, x + 3): x E R} 

g) {(a, 2a, 3a): a £ R} 

6 . Considere o subespaço de R 4 

S = 1(1,1, -2,4), (1,1, -1,2), (1,4, -4, 8 )| 

2 

a) O vetor (-j, 1 , - 1 , 2 ) pertence a 57 

b ) O vetor ( 0 , 0 , 1 , 1 ) pertence a S? 

7. Seja W o subespaço de M{ 2, 2 ) definido por 


W = 


a + 2b 
0 a - 6 


: a, b E R 


<0 


0 -2 


0 


1 


E IV? 


*) 


0 2 
3 1 


E IV? 


8 . Seja W o subespaço de Aí(3, 2) gerado por 

r 


L 


0 0 
1 1 
0 0 


0 l 
0 0 
0 0 


. O vetor 


pertence a IV? 


9. Mostre que 


1 0 
0 0 


0 1 
0 0 


0 0 
1 0 


0 0 
0 1 


é base de Aí( 2 , 2 ). 


10. Escreva uma base para o espaço vetorial das matrizes n X n. Qual a dimen¬ 
são deste espaço? 

11. Quais são as coordenadas de x = (1, 0, 0) em relação à base 0 - {(1, 1, 1), 

(- 1 , 1 , 0 )^( 1 , 0 ,- 1 )}? 
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12. Qual seria uma base “natural” para P n n . (Veja 0 Exemplo 4 de 4 . 2 . 2 ). Dê a di¬ 
mensão deste espaço vetorial. 

13. Mostre que os polinómios 1 - (1 - Q 2 , 1 - t e 1 geram o espaço dos 

polinómios de grau < 3. 

14. Considere [-a, a] um intervalo simétrico e C l (-a, a] o conjunto das funções 
reais definidas no intervalo [- a , a] que possuem derivadas contínuas no 
intervalo. Sejam ainda os subconjuntos V x = (A*) £ C 1 [- a , a] \f(~x)=f(x) i 
Vx G U a]} e v 2 = if(x)GC l [-u] IA-*) = -A*), V* e [-n, *]}. 

a) Mostre que C l [-a, a] é um espaço vetorial real. 

b) Mostre que V x e V 2 são subespaços de C 1 [~ a , a]. 

c) Mostre que V\®V% - C 1 [- a , 0 ]. 

15. Seja K 0 espaço das matrizes 2X2 sobre R, e seja IV o subespaço gerado 
por 


r. -5" 


1 


2 -4 


1 -7 

1 

f 

_l 

7 

L- 1 5 J 

> 

-5 7 

7 

_ ! 

1 

_J 


Encontre uma base, e a dimensão de IV. 


16. Seja P 0 conjunto de todos os polinómios (de qualquer grau) com coeficien¬ 
tes reais. Existe uma base finita para este espaço? Encontre uma base para 
P e justifique então por que P é conhecido como um espaço de dimensão 
infinita. 

17. a) Dada uma matriz A de ordem m X n, você pode considerar as m linhas 

como vetores do R” e o subespaço V, de R", gerado por estes m vetores. 
Da mesma forma para a matriz B, linha reduzida à forma escada de A, 
podemos considerar o subespaço IV gerado pelos m vetores, dados por 
suas linhas. Observando que cada linha de B é obtida por combinação 
linear das linhas de A e vice-versa (basta reverter as operações com as linhas), 
justifique que V = W. 

b) Mostre, ainda, que os vetores dados pelas linhas não nulas de uma matriz - 
-linha reduzida à forma escada são LI. 

18. Considere o subespaço de R 4 gerado pelos vetores = (1, -1, 0, 0), 
v 2 = ( 0 , 0, 1, 1), v 3 = (- 2 , 2 , 1, O e v 4 = (1, 0 , 0 , 0 ). 

a) O vetor ( 2 , - 3 , 2 , 2 ) G [rv ^1? Justifique. 

b) Exiba uma base para [vj, i' 2 i v 3> v 4 !* Qual é a dimensão? 

c) U’j, v 2 , ^ 3 , ^ 4 ] = R 4 ?P^r 
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19. Considere o subespaço de R 3 gerado pelos vetores Vj = (1, 1,0), 
v 2 = (0, -1, 1) e v 3 = (1, 1, 1). [v,, v 2 , v 3 ] = R 3 ? Por quê? 

20. Use o exercício 17 para exibir uma base para o subespaço S, definido no 
Exercício 6. Qual é a dimensão de SI 

21. Considere o sistema linear 

''ixi + 4*2 - 6*3 = a 
(§)- *1 - x 2 + 4*3 = b 
6*2 - 14*3 = c 

Seja W = {(jtj, x 2> x 3 ) G R 3 : ( x ít x 2t x 3 ) é solução de (§)}. Isto é, W é o 
conjunto-solução do sistema. 

a) Que condições devemos impor a a, b e c para que W seja subespaço ve¬ 
torial de R 3 ? 

b ) Nas condições determinadas em a) encontre uma base para W. 

c) Que relação existe entre a dimensão de W e o grau de liberdade do siste¬ 
ma? Seria este resultado válido para quaisquer sistemas homogêneos? 

22. Seja U o subespaço de R 3 , gerado por (1, 0, 0) e W o subespaço de R 3 , ge¬ 
rado por (1, 1, 0) e (0, 1, 1). Mostre que R 3 = U®W. 

23 Demonstre o teorema 4.3.5, isto é, mostre que, dados u = Wj + w 2 E 

E + W 2 e v = wi + w 2 E W x + W 2 (onde w 1? wi E W x e w 2 , w 2 E Ky, 

então u + v E W x + W 2 e ku E W x + W 2 para todo k G R. 

24. Mostre que, se V - W x ®W 2 e q ={v 1s v^} é a base de W Í9 

& = {w,, w r } é a base de W 2 então y - {vj, ..., v*, w h w f } é 

base de V. 

Mostre com um exemplo que o resultado não continua verdadeiro se a soma 
de subespaços não for uma soma direta. 

25. Sejam W x = {(x, y, z, t) |E R 4 | jc + y = 0 e z - t = 0} e 

W 2 = {(*, y, z, t) G R 4 | x - y - z + t = 0} 

subespaços de R 4 . 

a) Determine W x O W 2 . 

b ) Exiba uma base para W x n W 2 . 

c) Determine W x + W 2 . 

d) W x + W 2 é soma direta? Justifique. 

e) W x + W 2 = R 4 ? 
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26. Sejam 




tais que a - d e b - c 


W 2 =\ * ^ tais que a - c e b = d 


subespaços de M (2, 2) 

a) Determine W x n W 2 e exiba uma base. 

b) Determine + W 2 . É soma direta? W x + W 2 - M( 2, 2)? 

27. a) Dado o subespaço V x = {(x, y, z) E R 3 | x + 2y + z = 0} ache um 

subespaço V 2 tal que R 3 = V x © K 2 . 
b) Dê exemplos de dois subespaços de dimensão dois de R 3 tais que 
V x + V 2 = R 3 . A soma é direta? 

28. Ilustre com um exemplo a proposição: “Se U e W são subespaços de um 
espaço vetorial V que tem dimensão finita, então: 

dim(t/ + W) = dim U + dim W - dim(í/ n W ).” 

29. Sejam 0 = {(1, 0), (0, 1)}, 0, = {(-1, 1), (1, 1)}, 0 2 = {(VT, 1), (V^ -1)) 
e 03 - {(2, 0), (0, 2)} bases ordenadas de R 2 . 


a) Ache as matrizes de mudaça de base: 


0 


*> < 


iii) ut 


iv) Uf a 


b) Quais são as coordenadas do vetor v = (3, -2) em relação à base: 

i) 0 ii) 0, iii) 02 iv ) Pi 

c) As coordenadas de um vetor v em relação à base são dadas por 


Quais são as coordenadas de v em relação à base: 


30. Se , 110 

[/f =0-1 1 

a 

10-1 


a) [v] a onde [v] a - = 


b) [v] a - onde [v^ = 2 

3 
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31. Se 0' é obtida de 0, a base canônica de R 2 , pela rotação por um ângulo 
- y, ache 

«) mjf »> 

32. Sejam í, - «1, 0), (0, 2)}, 0, = {(-1, 0), (1, 1)} e 0, - {(-1. -1). (0, -0} 
três bases ordenadas de R 2 . 

a) Ache 

0 [tffi ÍO v§l iU) [I ti iv) [1 $i ’ l/1 & 

b) Se for possível, dê uma relação entre estas matrizes de mudança de base. 

33. Seja V o espaço vetorial de matrizes 2X2 triangulares superiores. Sejam 



duas bases de V. Ache [Z]^ 1 


34. Volte a 4.7.2 e mostre efetivamente que ([/^ ) 1 = UJ^' 


35. Se a é base de um espaço vetorial, qual é a matriz de mudança de base 
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4.9 RESPOSTAS 

4.9.1 Respostas de 4.8 

1. 0 = (0, 0, .... 0) e .... x„) = ..., - x „) 

2. a) Façamos os testes, lembrando-nos que o que define W são as condições 

dentro dos parênteses 

0 Sejam v i = Oi.-Vi, *i» h) <= W e p 2 = (. x 2 ,y 2 , z 2 , t 2 ) E W. 

Então v, + v 2 está ainda em IV? Vejamos: 

v, + v 2 = (x, + x 2 ,y 2 + y 2 , zi + z 2 , r, + t 2 ). 

Testemos se este novo vetor satisfaz as condições que definem W: 

(*i + x 2 ) + (y t + y 2 ) = (x, + ^i) + (x 2 + y 2 ) = 0 + 0 = 0 
(z, + z 2 )-(r, + t 2 ) = (zj - íj) + (z 2 - t 2 ) = 0 + 0 = 0 

pois v, e i> 2 estão em W e satisfazem as condições implicando que 
Vj + v 2 também o faça. Portanto v, + v 2 E W. 
ii) Seja v = (x, y, z, í) E W e A E R. Então X • v = (Ax, Xy, Az, A t). 
Testemos as condições: 

Ax + Aj' = A(x+_y) = A- 0 = 0 
Az-A/ = A(z-r) = A- 0 = 0 

Assim Av E W. Portanto W é subespaço. 
b) O mecanismo é análogo. 

3. a ) Façamos os testes para V. 

Sejam e \ ai ^ 2 vetores em V e A E R. Então 

[c, í/iJ [c 2 d 2 _ 

«1 b x + \ a 2 * 2 ] _ Ul + «2 /»1 + *2 1 e 

/> rflj [c 2 d 2 \*[c l + c 2 d, + d 2 \ 

vale que b 2 + b 2 = c t + c 2 pois b 2 = e b 2 = c 2 

x [“! *;]-[£; £]•- ^ b ‘- c <■ 

Portanto W é subespaço de M (2, 2). 

b ) Façamos os testes para W. Supondo os vetores acima em W ao fazermos 
a soma teremos que testar se ii + Ô2 = c 1 + c 2 +l, que é a propriedade 
que caracteriza W. Porém b x = c 1 + 1 e b 2 = c 2 + 1 e, portanto, 
b x + b 2 = C\ + 1 + c 2 + 1 = c t + c 2 + 2. Assim W não é subespaço. 
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Poderíamos ter a resposta mais rapidamente se observássemos que 


'O 0 

.0 0 


não está em W pois não satisfaz a propriedade que o caracteriza. 

Vamos exibir geradores apenas para V já que não existe este conceito em 
(V(não é subespaço). Observe que a forma mais geral de um vetor d 


a b d que pode ser escrita como ^ = a 0 o] + b [l o] 6 

d [° J] . Além to ,, • [‘ ®] . v, - [® J] e ■{” ?] «*• 

em V. Portanto, todo vetor de V é combinação linear de v 2 , v 2 e v 3 , ou 
seja, v,, v 2 , v 3 são os geradores procurados V = [v x , v 2 , v 3 J. 


k oi r°^. 


5. a) Sim;'l X , 

0 "' 0 _ 


k^ 0 

b) Sim; * 

0 M 


fr, ii ro n 

c ) Sin M|_l o} Lo lj 


<k° 

X ; " 

o X 


d) Sim; {(1, 1)}; 1 

e ) Não. 


7. a) Pertence 


„ a b _ \ 

9 ’ c d 0 


f) Não. 

g) Sim. {(1, 2, 3)}; 1. 
b ) Não pertence 


o] +6 [o SHS °i_ 


e os vetores são LI. 


ll. ui 


Espaço Vetorial 137 


13. Seja at 3 + bt 2 + ct + d = a(l - t 3 ) + 0(1 _ tf + 7(1 - t) + Ô 
Então -a = a, 0 = Z>, -20 - 7 = c, a+fl + y + b- d 
Portanto a = -a, d = b, 7 = -2b - c, ô = a + b + c + d. 

14. c) Note que toda função J{x) E C 1 (-a, a\ pode ser escrita como 

f{x) = F y (x) + F 2 (x) com F,(x) e /r 2 (x) 

Além disso F x (-x) = F x (x ) e F 2 (-x) = -F 2 (x) e portanto F x (x) E V , e 
F 2 (x) E V 2 . Assim Vi + V 2 = C l [-a, a]. Ainda que #(x)e V t O V 2 
devemos ter ao mesmo tempo g(-x ) = #(x) = -#(x) donde #(x) - 0 para 
todo x. Portanto V x O V 2 = {0} e C 1 [-a, a] = V l ®V 2 . 

16. Não; {( 1 , t, t\ .... t n , ...} 

18. a) Temos que saber se existem x, y, z e t E R tais que (2, -3, 2, 2) = 

= x(l,- 1 , 0 , 0 ) +y(0, 0 , 1 , 1 ) + z(- 2 , 2 , 1 , 1 ) + r(l, 0 , 0 , 0 ), ou seja, temos 
que saber se 0 sistema 

r 

x - 2 z + r = 2 

J - x + 2z = - 3 

y + z =2 

y + z -2 

é possível ou impossível. Utilizando as técnicas (operações com linhas) 
do Capítulo 2 obtemos que o sistema não somente é possível como 
admite infinitas soluções. Portanto (2, -3, 2, 2) pertence a 

* 2 , ^3 > 

b) Já pelo item (a) poderíamos afirmar que {v i% v 2 , v 3 , v 4 } não formam 
uma base pois uma das propriedades de uma base é o fato de qualquer 
vetor poder ser escrito de modo único como combinação linear dos 
vetores da base e, pelo item (a), como o sistema é indeterminado, 
existem infinitas maneiras de se fazer isto. Não utilizaremos isto, 
entretanto, no raciocínio que se segue. Coloquemos os vetores um sob o 
outro obtendo a matriz 



0 

1 

1 

0 



Operações com as linhas desta matriz são equivalentes no espaço vetorial 
a fazer combinações lineares e portanto as novas linhas serão ainda 


vetores do subespaço. Além disso, sendo as operações com as linhas 
reversíveis, as novas linhas gerarão os mesmos vetores que as Hnhas 
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originais. Assim, ao operarmos com as linhas da matriz para consegui-la 
na forma escada não estaremos alterando o subespaço e, na forma escada, 
as novas linhas não nulas representarão vetores linearmente independentes 
e que geram o subespaço, ou seja, uma base (veja o exercício 17 ). No 
nosso caso obtemos 


1 

-1 

0 

0 


1 

0 

0 

0 

0 

0 

1 

1 


0 

1 

0 

0 

-2 

2 

1 

1 


0 

0 

1 

1 

1 

0 

0 

0 


0 

0 

0 

0 


Pelo raciocínio anterior, sendo w, = ( 1 , 0 , 0 , 0), w 2 = (0, 1, 0, 0) e 
wj = ( 0 , 0 , 1 , 1 ), [vi, v 2 , v 3 , v 4 ] = [w u w 2 , w 3 ] e {w lf w 2) w 3 j é a 
base procurada. A dimensão, sendo o número de vetores da base, é 3. 

c) ÍVi, v 2 , v 3 , v 4 ] não é igual a R 4 pois dim [vj, v 2 , v 3 , v 4 ] = 3 e 
dim R 4 = 4. 

20 . {(1, 0, 0, 0), (0, 1, -1, 2)}; 2 

21. a) a = b = c = 0. 

b) Resolva o sistema operando com as linhas como no Capítulo 2. Verifique 
o grau de liberdade e quais são as variáveis livres. Atribua valor 1 para 
uma delas e zero para as outras e vá repetindo o processo para obter as 
soluções básicas (veja 2.5.7). Cada solução básica fornecerá um vetor da 
base de W (por quê?). 

c) A dimensão de W é exatamente o grau de liberdade pois cada grau 
determina uma solução básica do sistema. O resultado é válido para 
qualquer sistema homogêneo. 

22. dim[(l, 0 , 0 )] = 1, e dim[(l, I, 0), (0, 1,1)] = 2. Os três vetores são LI 
e portanto geram o R 3 . Como dim R 3 = 3, pela proposição 4.6.9 

dim {(1, 0, 0) O 1(1, 1, 0), ( 0 , 1 , 1)]} = 0. Então a soma é direta. 


24 . Sugestão: Suponha que 7 não seja base de V. Então ou Vj, ...» v*, w 1} w 2 
não geram V ou não são LI. As duas situações resultam numa contradição. 
Exemplo: Sejam W x o plano xy e W 2 o plano xz em R 3 . A soma não é di¬ 
reta. Uma base de e {( 1 , 0 , 0 ), (1, 1, 0 )} e uma de W 2 é {( 1 , 0 , 1 ), 

( 0 , 0 , 1 )}. Mas {(1, 0 , 0 ), ( 1 , 1 , 0 ), ( 1 , 0 , 1 ), ( 0 , 0 , 1 )} não é base de R 3 . 

25 . Inicie achando os geradores de W x e W 2 , observando que eles são dados 
por sistemas lineares e portanto devemos procurar as soluções fundamentais 
para tais sistemas (veja o exercício 21 e sua resposta). Para W> teremos 



x + y =0 

z - t - 0 

Portanto x = -yez = te teremos dois graus de liberdade fazendo y - 1 e 
t - 0 e depois j^ = 0 er = 1 , teremos os vetores w x = (- 1 , 1 , 0 , 0 ) e 
vv 2 - (0, 0, 1, 1 ) que são LI (verifique). Assim W x = [h^, w 2 ] t Para W 2 
teremos: x-y-z + t = 0 que fornece x = y + z - t com três graus de 

liberdade. Fazendo y = 1 , 2 = 0 e í = 0 , depois y - 0 y z = 1 e í = 0 e 

depois ^ = 0 , 2 = 0 e í = 1 teremos w 3 - ( 1 , 1 , 0 , 0 ), w 4 = ( 1 , 0 , 1 , 0 ) 
e vv 5 = (-1, 0, 0, 1 ) que são LI (verifique). Portanto W 2 = [u> 3 , w A , w 5 ]. 
Por outro lado W x n W 2 = {(x, y, z, t) \ x + y = 0 , z - t = 0 e 
x-jy-z + r^O}. Para achar Pi W 2 resolvemos o sistema 

fx+y = 0 

\ z - t = 0 

[x ~ y - z + t = 0 

Operando com as linhas (como no Capítulo 2 ), obtemos 

jc =0 

7 =0 
z - t - 0 

Portanto um grau de liberdade (na variável r). Fazendo t = 1 , teremos a 

solução x = 0 , y = 0, z = \ e t = i, ou seja, o vetor v = ( 0 , 0 , 1 , 1 ). 

Portanto 

a) W l nW 2 =[( 0,0,1,!)]. 

b) Uma base para W 2 é {(0, 0 , 1 , 1 )} (unidimensional). 

c) W x + W 2 = [(- 1 , 1 , 0 , 0 ), ( 0 , 0 , 1 , 1 ), ( 1 , 1 , 0 , 0 ), ( 1 , 0 , 1 , 0 ), (- 1 , 0 , 0 , 1 )] 

d) + W 2 não é soma direta pois W t n W 2 ^ {0} 

e) Para responder se W x + W 2 = R 4 vamos exibir uma base de W x + W 2 . 

Para isto, considere seus geradores e opere com eles como no exercício 18 
para obter novos geradores linearmente independentes 


-1 

1 

0 

0 


1 

0 

0 

0 

0 

0 

1 

1 


0 

1 

0 

0 

1 

1 

0 

0 

~ 

0 

0 

1 

0 

1 

0 

-I 

0 


0 

0 

0 

1 


0 

0 

1 


0 

0 

0 

0 


Portanto, W x + W 2 = J( 1 , 0 , 0 , 0 ), ( 0 , 1 , 0 , 0 ), ( 0 , 0 , 1 , 0 ), ( 0 , 0 , 0 , 1 )] 
e dim (W x + W 2 ) = 4 e portanto W x + W 4 = R 4 . 

27. a) Vamos calcular, inicialmente, os geradores de V 2 . Observe que o sistema 
linear x + 2y + z - 0 tem dois graus de liberdade. Então x - -2y - z. 
Fazendo y = 1 e 2 * 0 , obtemos a solução x = -2, y = 1 , z = 0, ou seja, 
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o vetor v j = (-2, 1, 0). Por outro lado, fazendo y = 0 e z =* 1. obtemos 
o vetor v 2 = (-1, 0, 1). Como toda solução do sistema é combinação 
linear dessas soluções fundamentais, todo vetor de V x é combinação 
linear de v, e v 2 . Portanto F, = [v,. v 2 ] (veja exercícios 21 e 25). 
Observe ainda que como v, e v 2 são LI, V x é de dimensão dois. m re 

agora que se temos subespaços IV, = [w,, w 2 , w k ] e 

W 2 = [w kti , .... w e ] então + IV 2) sendo formado pelos vetores que 

são obtidos por somas de vetores de IV, e vetores de W 2 , pode ser escnto 

IV, + JV 2 = [w,, w 2 . w k , w k+u ... w e ]. Portanto para obter Kj tal 

que V x ®V 2 - R 3 , ^2 deve ser gerado por apenas um terceiro ve or v 3 
LI com v, e v 2 (para completar a dimensão de R 3 )etalque 
y n V 2 = {0}. Podemos tomar, por exemplo, v 3 - (0, 0, 1) e 
v 2 = [(0, 0, 1)1 = {(V, y. Z) | X = 0, / = 0 e z £ R>. A disposição 

geométrica deste exercício é 



0 1 1 
0 0 1 



Procure outras soluções. 

b) Um exemplo seria V x = [(1, 0, 0), (0, 1, 0)] e V 2 = [(0, 1, 0), (0, 0, 1)]. 
Neste caso a soma não seria direta pois V x O V 2 = [(0, 1, 0)]. Note 
ainda que K, c V 2 poderiam ser escritos como V x = { (x, y t z) \ z = 0, 
x c y reais quaisquer} e V 2 = {(x, y , z) | x = 0 e y e z reais quaisquer}. 
Procure outros exemplos mas note que em nenhum exemplo a soma 
pode ser direta porque senão a dimensão de R 3 seria 4 (veja o exercício 29). 

35. A matriz identidade. 
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33 . 



TRANSFORMAÇÕES 

LINEARES 


5.1 INTRODUÇÃO 

Funções lineares descrevem o tipo mais simples de dependência entre variáveis. 
Muitos problemas podem ser representados por tais funções. Por exemplo: Se 
de um quilograma de soja, são extraídos 0,2 litros de óleo, de uma produção 
de jc kg de soja, seriam extraídos 0,2x litros de óleo. Escrevendo na forma de 
função, teremos 

ô(s) = 0,25, 

onde Q = quantidade em litros de óleo de soja e s = quantidade em kg de soja 
Estes dados podem ser colocados graficamente: 

0,2s 

s 

Figura 5.1.1 
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Vamos analisar neste exemplo simples duas características importantes: 

1) Para calcular a produção de óleo fornecida por (s l + s 2 )kg de soja, pode¬ 
mos tanto multiplicar (s 1 + s 2 ) pelo fator de rendimento 0,2, como calcular 
as produções de óleo de cada uma das quantidades e s 2 e somá-las, isto 
é, Q(s l + s 2 ) = 0,2(5, + s 2 ) = 0,2$! + 0,2$ 2 = Q(s x ) + Q(s 2 ). 

2) Se a quantidade de soja for multiplicada por um fator k, a produção de 
óleo será multiplicada por este mesmo fator, isto é, Q(ks) = 0,2 (ks) = 

= k(0,2s) = k ■ GO)- 

Estas duas propriedades, que neste caso são óbvias, servirão para caracte¬ 
rizar o que denominaremos “transformação linear”. Vejamos ainda um segundo 
exemplo de uma situação envolvendo mais fatores e que apresenta o mesmo 
comportamento. 

A quantidade em litros de óleo extraída por quilograma de cereal segundo 
um determinado processo pode ser descrita pela tabela. 



Soja 

Milho 

Algodão 

Amendoim 

Õleo (Ü) 

0,2 

0,06 

0,13 

0,32 


A quantidade total de óleo produzido por x kg de soja, y kg de milho, 
zkg de algodão e wkg de amendoim é dada por Q = 0,2x + 0,06y + 0,13 z + 
0,32h\ Observe que a quantidade de óleo pode ser dada pela multiplicação da 
“matriz rendimento” pelo vetor quantidade. 

x 

Q = 10,2 0,06 0,13 0,32] ^ = 0,2* + 0,06j + 0,13r + 0,32w 

w 

Formalmente, estamos trabalhando com a função Q:A C R 4 ->R 

" x 

[0,2 0,06 0,13 0,32] y 

z 

w 
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qiws, como no exemplo anterior, goza das propriedades: 



Você deve verificar e interpretar estas propriedades. 

Pensemos agora em termos de espaços vetoriais. Uma função entre espa¬ 
ços vetoriais, satisfazendo as condições 1 e 2, é a “mais natural possível’ , pois 
respeita toda a “estrutura” de espaço vetorial. 

5 1 1 Definição: Sejam V eW dois espaços vetoriais. Uma tramforrmçao 
linear (aplicação linear) é uma função de V em W, F: V-* W, que satisfaz as 
seguintes condições: 

i) Quaisquer que sejam u e v em V, 

F{\x + v) = F(u) + F(y) 

ii) Quaisquer que sejam k E R e v E V, 

F(kv) = kF(v) 


5.1.2 Exemplos 

Exemplo 1 : As funções apresentadas ao introduzirmos este capitulo, uma 
vez que as variáveis são positivas, são restrições das seguintes aplicações lineares 

i) V = W = R e Ô:R->R 

*•->■0,2*: 

ií) V = R\ W = R e <2:R 4 ^R 



0,06 


0,13 


0,32] 



Exemplo 2: 

V = R e W - R 

F:R -*■ R definida por u^au ou F(u) = au 
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Como F( u + v) = a(u + v) = au + av = F(u) + F(v), F satisfaz a primeira 
condição, e como F(ku) = a(£u) = A(au) = kF(u ), F satisfaz a segunda condi- 
çao. Logo F é uma transformação linear. 

Mais ainda, toda transformação linear de R em R só pode ser deste tipo. 
De tato, F(x) = F(x • 1) e como F é uma transformação linear e x um esca¬ 
lar, F(x ■ 1) = * • F( 1). Chamando F( 1) = temos F(x) = ax. 

O nome transformação linear certamente foi inspirado neste caso, V = 

- W = R, pois o gráfico de F(x) = ax é uma reta que passa pela origem. 

Exemplo 3 : 

F:R -* R 

u u 2 ou F( u) = u 2 . 

Você já pode concluir que F não é linear pelo que foi mostrado no exemplo 
anterior. Se você desconhecesse o resultado dado, teria que mostrar a não linea¬ 
ridade de F diretamente: 

F( u + v) = (u + v) 2 = u 2 + 2uv + v 2 
e F(u) + F(v) = u 2 + v 2 

Portanto, 

F( u + v) ¥= F( u) + F(v) 

Exemplo 4: 

V = R 2 e W = R 3 
F:R 2 -> R 3 

(x f y) (2x, 0, x + y) ou F(x, y) = (2x, 0 , x + y). 

Por exemplo, F(l, 2) = (2, 0, 3) E R 3 . 

Dados u, v E R 2 , sejam u = (x lf y x ) e v = (x 2> y 2 ) onde Xj, y\ E R. Temos: 

F {u + v) = F((x lf y { ) + (x 2 , y 2 )) = F(x x + x 2 , y x + y 2 ) 

= (2(x l + x 2 ), 0, (*! + x 2 ) + (y 1 + y 2 )) 

= (2x u 0, xi + 7 i) + (2x 2 > 0, x 2 + y 2 ) 

= F( u) + F(v) 

Logo, a primeira condição é satisfeita. Mais ainda, 

F(ku) = F(k(x, y)) = F{kx t ky) 

= (2 kx, 0, kx + ky) 

= k(2x, 0 , x + y) = kF( u) 


e a segunda condição é satisfeita. Então F é uma transformação linear. 
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Observação: Decorre da definição que uma transformação linear T:V~* W leva o 
vetor nulo de V no vetor nulo de W, isto é, se 0 6 V, T(0) = 0 & W. Isto nos 
ajuda a detectar transformações não lineares. Se 7'(0) -r- 0, T não é linear (veja 
o Exercício 1 da secção 5.6). Mas cuidado 7(0) = 0 não é suficiente para que 
1' seja linear (veja o Exemplo 3 acima). Assim, por exemplo, 7 :R -* R* onde 
T(x, y, z) = (x + 1 ,y, z) não é linear. 


Exemplo 5: 

Sejam V = W = /^(polinómios de grau 


< n) e D:P„ -*P n < a aplicaçao derivada 
/-/ 


que a cada polinómio / associa sua derivada, a qual também é um polinonno 
(com 1 grau a menos). Como para quaisquer funções deriváveis. 


D(f + g) = D(f) + D{g) 
D{kf) = kD(j), 


D é uma aplicação linear. 


Exemplo 6: A aplicação nula 

F.V^V _ . 

ukO é linear. Seria conveniente que você demonstrasse esta afirmaçao, p 1 

assim você poderia compreender melhor a definição 5.1.1. 

O próximo exemplo é muito importante. O que mostra este exemplo e 
que a toda matriz m X n está associada uma transformação linear de R em 
R m Em outras palavras, podemos dizer que uma matriz produz uma transfor¬ 
mação linear. A implicação inversa também é verdadeira, isto é, uma transfor¬ 
mação linear de R" em R" 1 pode ser representada por uma matriz m X n. Isto 
será mostrado posteriormente. 


Exemplo 7: 

V = R" e W = R m 

Seja A uma matriz m X n. Definimos 

i A • R” R m P or 

Vk> A * V 

r*i 


onde v é tomado como vetor coluna, v = 


L x n 


■> 

*1 


>l" 




x n 





Das propriedades de operações de matrizes: 

/, A (u + v) = A(u + v) = Au + Av = i A (u) + Z, A (v) e Z, A (Jfcu) = A(*u) = 
= Á(Au) - A7 . a (u). e portanto Z, A é uma transformação linear. 


Como caso particular suponhamos que A 
L A :R J ^R 3 


"2 O' 
0 0 



2 0 
0 0 
1 1 


x x 


2*i 


— 

0 






Xi + JC 2 


Então L a(*i, x 2 ) = (2x u 0, + x 2 ). 

Surpresa! Esta é a aplicação linear do Exemplo 4. 


Seria interessante que você também notasse o relacionamento que existe 
entre o Exemplo 1, e o Exemplo 7. 


5.2 TRANSFORMAÇÕES DO PLANO NO PLANO 

Agora iremos apresentar uma visão geométrica das transformações lineares, dan¬ 
do alguns exemplos de transformações do plano (R 2 ) no plano. Você verá assim, 
que, por exemplo uma expansão, uma rotação e certas deformações podem ser 
descritas por transformações lineares. 

5.2.1 Expansão (ou Contração) Uniforme: 

T: R 2 -> R 2 , a E R 
vh> a • v 

Por exemplo: T:R 2 -> R 2 

vh> 2v, ou T(x, y) = 2(x, y) 

Esta função leva cada vetor do plano num vetor de mesma direção e sentido 
de v, mas de módulo maior. 



Figura 5.2.1 


(v) = A • 
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Observe que, escrevendo na forma de vetores-coluna, 




0 

2 



Se tomássemos FR 2 - R 2 tal que F(x, y) = j (*, y), F seria uma contração. 


5.2.2 Reflexão em Torno do Eixo-x: 

F: R 2 ->R 2 
(x, y) H- (x, -y) 



5.2.3 Reflexão na Origem: 

T:R 2 -*■ R 2 

vi-> “V, ou seja, T(x, y) - (-x, -y) 



Figura 5.2.3 


Escrevendo na forma de vetores-coluna, temos 
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5.2.4 Rotação de um Ângulo 0: (no sentido anti-horário) 



Figura 5.2.4 


x = r cos (a + 0) = r cos a cos 0 - r sen a sen 0 
Mas r cos 0 = x e r sen 6 = y. 

Então x* = x cos 6 - y sen 0. 

Analogamente, y = r sen (a + 0) = r(sen a cos 0 + cos a sen 0) - y cos 0 + 
+ jc sen 0. 

Assim RflC*, 7 ) = (* cos 0 - .y sen 0, y cos 0 + * sen 0) ou na forma coluna, 

x t jc cos 0 - y sen 0 _ cos 0 -sen 0 x 

y y cos 0 + x sen 0 sen 0 cos 0 y 

Consideremos 0 caso particular onde 0 = Neste caso, cos0 - 0 e 
sen 0 = 1. 





Figura 5.2.5 
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5.2.5 Cisalhamento horizontal: 

T(x, y) = (x + ay t y), a € R 
Por exemplo: T(x, y) = (x + 2y, y) 


X 


X + 2y 


í 1 2 1 


X 

y 

i—► 

y 


0 1 1 


y 



Como já ressaltamos, as transformações do plano no plano apresentadas 
através dos exemplos anteriores são lineares, pois são dadas por A - v onde 
A é uma matriz 2 X 2. A aplicação a seguir não é linear. 

5.2.6 Translação: 

T(x, y) = (x + ü, y + b) 


X 


’ i 

o' 


X 


r *l 

_ y _ 


0 

_ 

1 


y m 


W 


Esta é uma translação do plano segundo o vetor (a, b) e, a menos que a = b = 
= 0, T não é linear. Por quê? 

(Veja a observação depois do Exemplo 4.) 

5.3 CONCEITOS E TEOREMAS 

Separamos nesta secção os resultados que darão uma estrutura para um estudo 
mais fecundo das transformações lineares. 

Um fato importante sobre aplicações lineares é que elas são perfeitamente 
determinadas conhecendo-se apenas seu valor nos elementos de uma base. 



5.3.1 Teorema: Dados dois espaços vetoriais reais V e W e uma base de V, 
í v i, v «}, sejam Wj w„ elementos arbitrários de W . Então existe uma 
única aplicação linear T :V -+ W tal que r(vj) = w,, T(y n ) = w*. 

Esta aplicação é dada por: 
se v ^ a lVl + ... + a„v n , 

T{y) = fl,r(v,) + ... + a„T(v„) 

- ^iW| + ... + a n w„ 

Verifique que T assim definida é linear e que é a única que satisfaz as 
condições exigidas. 

5.3.2 Problemas 

Problema 1: Qual é a transformação linear T:R 2 -*R 3 tal que T( 1, 0) = 

= (2, : 1, 0) e T( 0, 1) = (0, 0, 1)? 

Solução: Temos neste caso e, = (1, 0) e e 2 = (0, 1) base de R 2 e w, = (2, -1,0) 
ew, =(0,0, 1). 

Dado v - (x { , x 2 ) arbitrário, 

v - x^i + x 2 e 2 
e T(y) = xj(e } ) + x 2 T(e 2 ) 

= *i(2, -1,0)+ x 2 (0, 0, 1) 

= (2x u -x u x 2 ) 

Problema 2: Qual é a transformação linear T:R 2 ^R 3 tal que T( 1, 1) = 

= (3, 2, I) e 7(0, -2) = (0, 1,0)? 

Resolva o problema como exercício, mas, cuidado! Aqui não temos base canô¬ 
nica. Veja o Exercício 4 a da secção 5.6. 

Vamos analisar mais profundamente as transformações lineares, obtendo 
alguns resultados úteis e ao mesmo tempo interessantes. Para começar necessita¬ 
mos definir imagem e núcleo, que são dois subconjuntos especiais dos espaços 
vetoriais envolvidos na definição da transformação linear. 


5.3.3 Definição: Seja T.V^W uma aplicação linear. A imagem de T é o 
conjunto dos vetores w E W tais que existe um vetor v € V, que satisfaz 
T(v) = w. Ou seja 

lm(T) = {w e W, T(v) = w para algum v E V] 

Observe que Im(T) é um subconjunto de W e, além disso, é um subespaço ve¬ 
torial de W. (Veja o Exercido 16 da secção 5.6.) Às vezes Im(T) é escrito co¬ 
mo T(V). 
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5.3.4 Definição: Seja T\V->W uma transformação linear. 0 conjunto de 
todos os vetores v E V tais que T(v) = 0 é chamado núcleo de T> sendo deno¬ 
tado por ker(T). Isto é 

ker(T) = {vG V; T(v) = 0} 

Observe que ker(T) C V é um subconjunto de V e, ainda mais, é um subes- 
paço vetorial de V. (Veja o Exercício 16 da secção 5.6.) 


V T W 



Figura 5.3.1 

5.3.5 Exemplos 

Exemplo 1: 

T: R 2 ^R 

(x,y)^x+y 

Neste caso temos ker T = {(*, y) £ R 2 ; x + y = 0}, isto é, ker Té a reta 
y = -x. Podemos dizer ainda que kerT = {(x, -x); x £ R} = {x(l, -1); 
x £ R} = [(1, -1)]. ImT = R, pois dado w £ R, w = T(w, 0). 



Figura 5.3.2 
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Exemplo 2: Seja a transformação linear 

T: R 3 -*R 3 dada por T(x, y, Z ) = (x, 2y, 0). 

Então a imagem de T 

Im(T) = i(x, 2y, 0): x, y e R} 

= {x(l, 0, 0) + y(0, 2, 0): x, y £ R} 

= <(1, 0, 0),(0, 2, 0)> 

Observe que dim/m(r) = 2. 

O núcleo de T é dado por: 

ker{T) = {(x, y, z ): T(x, y, Z ) = (0, 0, 0)} 

= {(x, y, 2 ); (x, 2 y, 0) = (0, 0, 0)} 

= {(0, 0, 2): r £ R} 

= {z(0, 0, 1): 2 £ R} 

= [(0,0,1)] 

Observe que dim ker(T) 

Vamos recordar agora as noções de função injetora e sobrejetora e posterior¬ 
mente estabelecer o relacionamento entre estes conceitos e os de núcleo e ima¬ 
gem quando a função é uma transformação linear. 

5.3.6 Definição: Dada uma aplicação (ou função) T:V-> W, diremos que 

T é injetora se dados u G V, v G V com T(u) = T(v) tivermos u = v. Ou equi¬ 

valentemente, T é injetora se dados u, v £ V com u # v, então T(u) =£ T(v ). 

Em outras palavras, T é injetora se as imagens de vetores distintos são 
distintas. 


Figura 5.3.3 

5.3.7 Definição: A aplicação T: V^ W será sobrejetora se a imagem de T 
coincidir com W, ou seja T(V) = W. 

Em outras palavras, T será sobrejetora se dado w £ W, existir v £ V tal 
que T(v) = w. 



Figura 5.3.4 
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Exemplo 

T: R^R 2 
x»(x, 0 ) 

Mostremos agora que se T é injetora, então ker T - { 0 }. Seja v E ker(T ), isto 
Então (jt, 0) = (y, 0) implicando que x - y. Logo T é injetora. Mas T não é 
sobrejetora uma vez que Im(T) =£ R 2 . 

A transformação do Exemplo 1 de 5,3.5 é sobrejetora mas não é injetora, 
e a do Exemplo 2 de 5.3.5 não é nem injetora nem sobrejetora. Um bom exer¬ 
cício seria você examinar os exemplos de transformações lineares dados até 
aqui e decidir se são injetoras ou sobrejetoras. 

O próximo teorema afirma que uma transformação linear injetora só tem 
o vetor nulo no seu núcleo. E, por outro lado, se uma transformação linear ti¬ 
ver somente 0 no núcleo, então quaisquer dois vetores distintos devem ter ima¬ 
gens distintas também. 


5.3.8 Teorema: Seja T.V^W, uma aplicação linear. Então ker(T) = {0}, 
se e somente se T é injetora. 

Prova’. Mostremos primeiro que se ker T = {0}, então T é injetora. 

Suponhamos que u, v E V tais que T( u) = r(v). Então T( u) - T(\) = 

= T(u - v) = 0, isto é, u - v E ker(T). Mas por hipótese o único elemento do 
núcleo é 0. Então u - v - 0, isto é, u = v. Em resumo: como T( u) = T(\) 
implica que u = v, T é injetora. 

Mostremos agora que se T é injetora, então ker I = {0}. Seja vE ker(T ), isto 
é, r(v) = 0. Como necessariamente T( 0) = 0, T(\) - T{ 0). Logo v = 0, pois 
T é injetora. Portanto, o único elemento do núcleo é 0, ou seja, ker(T) - {0}. 

Voltando ao Exemplo de 5.3.7, observe que podemos dizer se T é injeto¬ 
ra simplesmente calculando o seu núcleo. Para que (x, 0) seja o vetor nulo, de¬ 
vemos ter x = 0 e portanto ker T = {0}, donde concluímos que T é injetora. 

Uma conseqüência da proposição 5.3.8 é que unia aplicação linear injeto - 
ra leva vetores LI em vetores LL (Veja o Exercício 9 da secção 5.6.) 

Um resultado importante, que relaciona as dimensões do núcleo e imagem 
de uma transformação linear T : VW, com a dimensão de V é dado pela se¬ 
guinte proposição. 


5.3.9 Teorema: Seja T:V -> W uma aplicação linear. 
Então dim ker T + dim ImT - dim V. 
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Prova: Considere v,, \ n uma base de ker T. Como ker T C Fé subespaço. 
de V y podemos completar este conjunto de modo a obter uma base de V. 

Seja então {v,, v„, w,, ..., w m } a fc ase de V Queremos mostrar que 

T( w t ), ..., 7(w m ) é uma base de lm T, isto é, 

0 [r(w0, ..., T(* m )] = ImT 
ii) {T(yr t ), T( w m )} é linearmente independente. 

Provemos /) 

Dado w E /m 7\ existe u E V tal que r(u) = w. Se u E V, então 
u = ü 1 v 1 + ... + a n \ n + b l wj + ... + b m vt m . Mas, 

w = r(u) = T(a l \ l + ... + a n \ n + b { Wj + ... + b m v/ m ) 

= a \T(\ x ) + ... + a n T(\ n ) + b^T(yt x ) + ... f b m T(w m ) 

Como os vetores v l5 ..., v„ pertencem ao ker T, Tivj) = 0 para i = 1, .... n 
Assim, 

w = b x T( w,) + ... + b m T( w m ) 

e a imagem de T é gerada pelos vetores ^(wj), T(v/ m ). 

ii) Consideremos agora, a combinação linear 

<*iT(vrt) + a 2 T( w 2 ) + ... + a m T( w m ) = 0 

e mostremos que os a,- são nulos. 

Como T é linear, T(a v vi x + a 2 v/ 2 + ««■ + a m w m) = 0. 

Logo a jWi + ... + E ker T, 

Então fljWj + ... + a m y/ m pode ser escrito como combinação linear da base 
(vi, ..., \ n ] de ker(T), isto é, existem b l9 b n tais que 


a\ Wi 

+ ... + a m w OT = è,v, + . 

- + b n v n , 

ou ainda, 


ü \ Wí 

+ ... + a m w m - 6,vj - . 

- b n \ n = 

0 


Mas {ví, .. 

., v„, w,, ..., w m } é uma 

base de V, 

e temos então a x ^ a 2 = 

— 

ji 

Cs 

3 

II 

II 

II 

O 

II 

O 





Decorrem desta proposição dois resultados: 

5.3.10 Corolário: Se dim V = dim W, então Tlinear é injetora se e somente 
se T é sobrejetora. 

Faça a demonstração como exercício. 

5.3.11 Corolário: Seja T : V W uma aplicação linear injetora. Se 
dim V - dim W y então T leva base em base. 
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Prova : Considere {v l5 v„) base de V. O conjunto T(v„)} C W é Ll 

pois dados escalares k ly ..., k n tais que k l T(v l ) + ... + k n T(y n ) - 0, temos 
T(k l \ l + ... + k n y n ) = 0. Logo k x y x + ... + k n \ n - 0. Mas {v,, ..., v„} é LI. 
Logo ki = ... = k n - 0. Desde que dim V = dim W = n, (TXvj), ..., 7Xv n )} é 
base de W . (Veja 4.6.8.) 

5.3.12 Quando uma transformação linear T: VW for injetora e sobreje- 
tora, ao mesmo tempo, dá-se o nome de isomorfismo . Quando há uma tal trans¬ 
formação entre dois espaços vetoriais dizemos que estes são isomorfos . Sob o 
ponto de vista de Álgebra Linear, espaços vetoriais isomorfos são, por assim di¬ 
zer, idênticos. Observe que devido à proposição 5.3.9 espaços isomorfos devem 
ter a mesma dimensão. Portanto, pelo corolário 5.3.11, um isomorfismo leva 
base em base. Além disso, um isomorfismo T: V ^ W tem uma aplicação inver 
sa V que é linear, como você poderia provar, e também é um isomor¬ 

fismo. 

Exemplo : Seja T : R 3 -> R 3 dada por T(x, y, z) = (x - 2 y, z, x + y ). Va¬ 
mos mostrar que T é um isomorfismo, e calcular sua inversa T~ l . 

Se pudermos mostrar que T é injetora, teremos que T é um isomorfismo 
pelo corolário 5.3.10. Isto equivale a mostrar que ker T = {(0, 0, 0)}. Mas 
ker T - {(*, y, z)\ T(x , y, z) = (0, 0, 0)} e T(x , y 9 z) = (0,0, 0) se e somen¬ 
te se (x - 2 y 9 z, x + y) = (0, 0, 0). Resolvendo o sistema de equações lineares 

* - 2 y = 0 
z = 0 
x + y = 0 

achamos que r ^ = z = 0éa única solução e portanto T é um isomorfismo. 

Tomando a base canônica de R 3 , sua imagem pela T é {7X1,0, 0), 7(0, 1, 0) 
r(0, 0, 1)} = {(1, 0, 1), (-2, 0, 1), (0, 1, 0)} que é ainda uma base de R 3 . É 
conveniente que você verifique isto. Calculemos agora a aplicação inversa de T . 
Como 7X1, 0, 0) = (1, 0, 1), T(0, 1, 0) = (-2, 0, 1) e T{ 0, 0, 1) = (0, 1, 0), 
temos que 7^(1, 0, 1) = (1, 0, 0), r\-2 9 0, 1) - (0, 1, 0) e ^(O, 1, 0) - 
- (0, 0, 1). Queremos calcular T^(x t y, z). Para isto escrevemos (x, y, z) em 
relação à base {(1, 0, 1), (-2, 0, 1), (0, 1, 0)}, obtendo: 

(x, y, z) = (1, 0, 1) + L j 2L (-2, o, 1) + .H0, 1, 0). 

Então r\x, y, z) = 1, 0, 1) + T'\-2, 0, 1) + ^-'(0,1,0). 


T'\x, y, z) = 


( x + 2z 
( 3 



Ou seja, 
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5.4 APLICAÇÕES LINEARES E MATRIZES 

Nesta seção veremos que num certo sentido 0 estudo das transiormações linea¬ 
res pode ser reduzido ao estudo das matrizes. Você já viu no Exemplo 7 de 
5.1 que a toda matriz m X n está associada uma transformação linear: T :R rt -> R™. 
Vamos formalizar, a seguir, este resultado para espaços vetoriais V e W e 
também estabelecer o seu recíproco, isto é, veremos que uma vez lixadas as 
bases, a toda transformação linear T: V -► W estará associada uma única matriz. 

inicialmente veremos como, dados dois espaços vetoriais V e W com bases 
0 e $ e uma matriz A, podemos obter uma transformação linear. 

5.4.1 Consideremos R 2 e as bases 

0 = {(1, 0), (0, 1)} e fi' = {(1, 1), (-1, 1)} 

e a matriz A = 

Queremos associar a esta matriz A uma aplicação linear que depende de A e 
das bases dadas 0 e j3', isto é, 

T A :R 2 ^R 2 

vh> r A (v) 


Considere v = (x, y). Seja X = [v]^ = ^ 

= ^1 =tfA(v% 

- 


Figura 5.4.1 

Então, r A (v) - 2x(\, 1) + y(-\, 1) * (2x - y, 2x + y). 

Por exemplo, se v = (2, I), então 7" A (2, 1) = (3, 5). Note que se tivéssemos 
partido de 0 = j3' = {(1, 0), (0, 1)}, teríamos obtido r A (v) = (2x, y) = Av. 



Figura 5.4.2 
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De um modo geral, fixadas as bases 0 = {v,, v„} e 0' - {w,, ..., w m }, 

à matriz 


podemos associar 



7a:R" -R m . 

Vh> T\(\) como: 


Seja X = [v]jj 



A • X = 


<*u 

a m\ 



Então, T\(v) = >’ l w 1 + ... + y m w m onde yt = A; • X e A/ é a i-ésima linha 
de A. 

Em geral, dada uma matriz A mX „, ela é encarada como uma aplicação 
linear T&: R" -*■ R m em relação às bases canônicas de R" e R" 1 . 


Exemplo: 

A - j 4 _i = ft 1 ’ °)> (°- e 
. 

0 ' = {( 1 , 0 , 0 ), ( 0 , 1 , 0 ), ( 0 , 0 , 1 )}. 

rA:R 3 -*-R 2 . Encontremos esta transformaçao linear. 

x 

Seja X = y 



x - 3y + 5z 
2x + 4y - z 


Então T\(x, y, z) = (x ~ 3 y + 5z)(l, 0) + (2x + 4 y - z)(0, 1) - 
= (x - 3y + 5z, 2x + 4y - z) 
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5.4.2 Agora iremos encontrar a matriz associada a uma transformação 

linear. Seja T:V -> W linear, 0 - {v^ v„} base de V e $ = {wi, w ffl ) 

base de W . Então 7^), .. <5 T(v n ) são vetores de W e portanto 

r(vj) = a n w, + ... + 

= #irt w i + + 

A transposta da matriz de coeficientes deste sistema, anotada por [T é cha¬ 
mada matriz de T em relação às bases (3 e p'. h 

a \\ ••• a \n 

: : = A 

a mn 

Observe que T passa a ser a aplicação linear associada à matriz A e bases 0 e 
isto é T = r A . 

5.4.3 Exemplos 

Exemplo 1 : 

Seja T:R 3 -> R 2 tal que r(x, j/, z) = (2x + jy - z, 3x - 2y + 4z). 

Sejam 0 = {(1, 1, 1), (1, 1, 0), (1, 0, 0)} e 0' = {(1, 3), (1, 4)}. 

Procuremos 17$. 

Calculando T nos elementos da base 0, temos: 

7X1, 1, D - (2, 5) = 3(1, 3) - 1(1, 4) 

7X1, 1, 0) = (3, 1) = 11(1, 3) - 8(1, 4) 

7X1, 0, 0) = (2, 3) = 5(1, 3) - 3(1, 4) 


Observe que se fixarmos outras bases 0 e 0', teremos uma outra matriz 
para a transformação T. 

Exemplo 2\ 

Seja T a transformação linear do Exemplo 1 e sejam 0 = {(1,0, 0), 

(0, 1, 0), (0, 0, 1)} e 0' = {(1, 0), (0, 1)}. 
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Calculemos 


T( 1, 0, 0) (2, 3) = 2(1, 0) + 3(0, I) 

T(0, 1, 0) = (1, -2) = 1(1, 0) - 2(0, 1) 
7(0, 0, 1) = (-1, 4) = -1(1, 0) + 4(0, 1) 


4- 3 


1 -1 

-2 4 


Observação : Usa-se denotar simplesmente por [T] à matriz de uma trans¬ 
formação linear T:R m -► R n em relação às bases canônicas. Assim, no Exemplo 2 

[TÉ* - [Tl Também é comum usar-se a notação simplificada: 7v = 7\v). 


Exemplo 3: Seja T:V^ V 
Vh+ v 


Isto é, T é a identidade. 

Sejam 0 = {v l5 v„} e 0' = {v\, vJJ bases de V. Calculemos lT]v. 


Como 

ii 

£ 

ii 

> 

+ ... 

* a ni^n 


Tv„ = 

Vn = a ln v\ 

+ ... 

+ a nnVtu 


II 

‘ a n ... 

a \n 

1! 



ü m 

a nn 



a matriz mudança de base. Veja 4.7.1. 

Exemplo 4: Dadas as bases 0 = {(1, 1), (0, 1)} de R 2 e 0' = {(0, 3, 0), 
(-1, 0, 0), (0, 1, 1)} de R\ encontremos a transformação linear T: R 2 R 3 cuja 
matriz é 

\ 0 2 
[T& =-10 
[-1 3 

Interpretando a matriz, temos: 

nu 1) = 0(0, 3, 0) - 1(-1, 0, 0) - 1(0, 1, 1) = (1, ‘1, -1) 
r(0, 1) = 2(0, 3, 0) + 0(-l, 0, 0) + 3(0, 1, 1) - (0, 9, 3) 

Devemos encontrar agora T(x, y). Para isto escrevemos (x, y) em relação à ba¬ 
se 0: 

O. y) = jc(i, 1) + (y - x)(0, í) 
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Aplicando T e usando a linearidade, temos; 

T{x. y) = *7X1, 1) + (y - x)7’(0, 1) 

- *0. -1, -1) + O - x)(0, 9, 3) 

= (x, 9 y - 1 Ojc, 3y - Ax) 

O resultado a seguir dá o significado da matriz de uma transformação 

linear. 


5.4.4 Teorema: Sejam V e W espaços vetoriais, a base de V, 0 base de W 
e T: V-+ W uma aplicação linear. 

Então, para todo v E. V vale: 

tnv)]/3 = I7-Ç • 



Para ficar mais fácil a compreensão faremos a demonstração no caso dim V = 2 
e dim W - 3. O caso geral é totalmente análogo e pode ser feito como exercí¬ 
cio. 

Prova: Sejam a = (v,, v 2 } base de V e 0 = (wj, w 2 , w 3 } base de W e 

a w Q\2 r x i 

l7]p = a 2{ ^22 • Sejam ainda ve V e [v^ = ^ e [Tv]p = y 2 

a 31 a 32 ,^3 

Da matriz [T]^ sabemos que 

T\ { - tfijWi + ^21 W 2 + ^31^3 

T\ 2 = tf 12 W, + ^22 W 2 + fl 32 w 3 
Além disso, v = x l v l + x 2 v 2 e como T é linear, 

Tv = x l T\ l + x 2 7V 2 

- Xi(a n W| + ü 21 w 2 + iW 3 ) + x 2 (a l2 w l + a 2 2 w 2 + a 32 w 3 ) 

= (ühXy + a l2 x 2 )Wi + (<* 21*1 + ^22*2)w 2 + (a 31 x, + fl 32 x 2 )w 3 . 

Mas Tv = y\W\ + >’ 2 W 2 + y 3 W 3 e C0IT10 as coordenadas em relação à base 0 

são únicas, temos , „ ^ 

y i = (*uXi + <*12*2 

y 2 — ^ 21*^1 + @ 22^2 
V 3 = #31*1 + fl 32*2 

Biblioteca de 
Ciência & Tecno 

I icrn^ 
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ou seja, 


>1 


*11 

ü \ 2 


y. " 

72 

= 

<*2l 

<*22 


x 2 

73 


31 

ü 32 




Isto é, L7v]p = 

Através deste teorema, o estudo de transformações lineares entre espaços 
de dimensão finita é reduzido ao estudo de matrizes. Quando V = W e T = /, 
observe que o resultado é o mesmo da matriz de mudança de base dado em 
4.7.1. 

Exemplo : Seja a transformação linear T:R 2 R 3 dada por 




i -i 
0 1 
-2 3 


onde a = {(1,0), (0, 1)} é base de R\ & = {(1, 0, 1), (-2, 0, 1), (0, 1, 0)} é 
base de R 3 . Queremos saber qual e' a imagem do vetor v = (2, -3) pela aplica- 
ção T. Para isto, achamos as coordenadas do vetor v em relação à base a, 


obtendo [v 


la* íj|-. 

. . 


a seguir, usando o teorema, temos 



" 1 

-i ■ 


A 


■ 5 

= [7-Ç[v] a = 

i 

0 

i 


2 

- 

-3 

-2 

3 




-13 


ou seja, 


7v = 5(1, 0, 1) - 3(-2, 0, 1) - 13(0, 1, 0) 
= (11, -13, 2) 


O relacionamento entre as dimensões do núcleo e da imagem de uma 
transformação linear e o posto de uma matriz a ela associada é dado no teore¬ 
ma a seguir, cuja demonstração deixamos ao seu encargo. 

5.4.5 Teorema: Seja T : V -► W uma aplicação linear e a e 0 bases de V e 
W respectivamente. Então 

áunIm(T) = posto de [T^ 

dim ker(T) = nulidade de [T 1 ]^ 

= número de colunas - posto de [T]^. 
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5.4.6 Teorema: Sejam T { :V-+ W e T 2 :W-> jj transformações lineares e a, 
0 , y bases de V, W e U respectivamente. Então a composta de com T 2i 
r 2 o7V {/, é linear e 


[T 2 oT^^[T 2 f y .[ T ^ 



A demonstração desse teorema é direta mas bastante trabalhosa. Por esta 
razão não a faremos aqui, indicando apenas suas etapas. Podemos efetuá-la sim¬ 
plesmente lembrando a construção das matrizes das transformações T x e T 2j 
obtendo desta forma suas atuações sobre as bases respectivas. A seguir, por 
composição achamos o que T 2 oT x faz na base de K, e chegamos então à matriz 

[T 2 oT x f r observando que esta é exatamente o produto das matrizes anteriores. 

5.4.7 Exemplos 

Exemplo 1 : Consideremos uma expansão do plano R 2 dada por 
T\(x, y) = 2(x, y ), e um cisalhamento dado por T 2 (x, y) = (x + 2 y, y). Ao 
efetuarmos primeiro a expansão e depois o cisalhamento, teremos a seqüência 



Figura 5.4.5 
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As matrizes (em relação à base canônica de R‘, £) das transformações sao 


2 0 1 e \T Í - f 1 2 
0 2 [Tl h 0 1 


Então, a matriz (em relação à base canônica de R 2 ) da aplicaçao que expande 
e cisalha (que é justamente a composta T 2 o T,) será 


12 2 0 
0 1*02 


Exemplo 2: Sejam as transformações lineares T x . R 2 R 3 e T 2 : R 3 ^ R 
cujas matrizes são 


[mjl- * -i e \. T 2Í f - ooo 
0 1 L 


em relação às bases oc = {(1, 0), (0, 2)}, 0 - {( ^, 0, -3), (1, 1, 15), (2, 0, 5)} 

e j = {^2, 0), (1, 1)}. Queremos encontrar a transformação linear composta 
T 2 oT í :R 2 ^ R 2 , ou seja, precisamos achar ( T 2 °T l )(x ; y). 

Para isto, usamos o teorema anterior para achar a matriz da composta. 


inoT-.ç. j 


1 0 

l -1 = 

0 1 


1 -2 

0 0 


Escrevemos agora as coordenadas do vetor (x, y) em relação à base a. 


l(*. y)\x 


Então, usando o teorema 5.4.6, temos 


" 1 -2 x - y 

L( T 2 oT } )(x, y)]y = oj y = [ o' 


Portanto, (T 2 °T\)(x t y) - (x - j)(2, 0) + 0(1, 1) - ( 2 x - 2y, 0). 
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5.4.8 Corolário: Se T: V W é uma transformação linear inversível (T é 
um isomorfismo) e ot e 0 são as bases de V e então T ~ l : W -> V é um ope¬ 
rador linear e 

[T-'i = 



Figura 5.4.6 

Prova: A matriz identidade, [/]® = [7' -l o7']^ = [T 

5.4.9 Corolário: Seja T: V^ W uma transformação linear e a e 0 bases de 
V e IV. Então T é inversível se e somente se det 1 T =£ 0. 

Exemplo: Seja 7’:R 2 ->R 2 uma transformação linear dada por 



onde % é a base canônica de R 2 . Como det[r]^ = 1, o corolário 5.4.9 afirma 
que T é inversível. Pelo corolário 5.4.8 sabemos que 

t 3 4 l -1 3 _4 

3 J - L-2 3. 

t f x 3 -41 x 1 3x - 4y 

Então \T~'{x, y)\% = [T \\ y ~ 3 ' y = -2x + 3 y . 

ou seja, T~ l (x, y) = (3.x - 4 v. -2x + 3y). 

Se T: V-* W é uma aplicação linear, a, a’ bases de V e j3, 0‘ bases de IV, 
podemos relacionar as matrizes (7’]^ e do seguinte modo: 
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5.4.10 Corolário: 



Figura 5.4.7 


[T]p = [/oro/Ç,' = [/$ [rÇ [/]"' 

Em palavras, conhecendo a matriz de uma transformação linear em relação a 
certas bases oc e 0 e as matrizes de mudança de base para novas bases ot e 0 , 
podemos achar a matriz da mesma transformação linear, desta vez em relação 
às novas bases a e 0\ 

Como caso particular da situação anterior temos: 

Se T: V-* K é uma transformação linear e a e j3 são bases de K, então 



Figura 5.4.8 


mj* = i/oro/j- uç [rgmj. 

Lembrando que [7]^ = (l/]^) _1 e chamando [7]^ = A, vem que 

[tÍq - A • • A' 1 

Dizemos neste caso que as matrizes [r]^ e (7']^ são semelhantes. 

Pelo corolário anterior, observamos através de mudanças convenientes de bases 
qual a modificação que a matriz de uma transformação linear sofre. 
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Exemplo : Seja a transformação linear r:R 3 -»R 3 cuja matriz em relação 
à base canônica £ é 

. [-2 4 -4“ 

m|= i -2 i 

K [ 3-6 5 

Calculemos a matriz desta transformação em relação à base £ = {70, 1L 1), 

(-1. 0, 1), (1, 1, 1)}. Para isto, usamos a relação [7"|j = [7]jj [rj| [7^ onde 

^ f° -1 1 1 t r-1 2 -1 

t7K = 1 0 0 e ([7]I)= [7É)-‘ =0-1 1 

1 1 1 J 1 -1 1 

Então f-1 0 0 

ÍTÍ= 0 2 2 

0 0 0 . 

Isto nos sugere a pergunta: Dada uma transformação linear, há um proce¬ 
dimento prático para se calcular uma base em que a matriz desta transformação 
seja a “mais simples possível”? A resposta a esta pergunta será um dos nossos 
objetivos nos próximos dois capftulos. 

*5.5 APLICAÇÕES À ÓPTICA 

Consideraremos nesta secção o caso de um feixe de luz de raios paralelos (cuja 
direção pode, portanto, ser dada por um vetor) que se reflete em espelhos 
planos. 

Iniciamos observando a situação mais simples possível: a propagação se dá 
no R 2 (isto é, estamos observando o fenômeno de perfil) e o espelho está co¬ 
locado no eixo horizontal (veja a Figura 5.5.1) 
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Dado um raio de luz incidente na direção do vetor (a, b)> perguntamos 
em que direção ( c ; d) estará o raio refletido? 

Para responder a esta pergunta devemos recordar um pouco sobre as leis 
que regem a reflexão da luz em um espelho. São elas: 
j) O raio de luz incidente, a normal ao espelho no ponto de incidência 
e o raio refletido estão no mesmo plano. 

ii) O ângulo entre o raio incidente e a normal ao espelho é o mesmo que o 
ângulo entre a normal e o raio refletido. 

iii) Supondo que o espelho é perfeito, isto é, não há absorção da luz, a luz 
se reflete com a mesma intensidade que tinha na incidência. 

No caso simples que temos, não precisamos nos preocupar com (i) pois 
as propagações se dão no mesmo plano. Se o comprimento do vetor indicar a 
intensidade da luz, (iii) indica que o vetor refletido terá o mesmo tamanho que 
o incidente. Estes resultados, juntamente com (ii), implicam que c = a e d = -b, 
ou, em forma de matriz 



Podemos concluir, portanto, que um espelho plano atua sobre os raios 
luminosos como uma transformação linear E (compare com 5.2.2). 

Passemos agora a estudar qual é a matriz associada a um espelho numa 
posição um pouco mais geral (veja a Figura 5.5.2), isto é, formando um 
ângulo 6 com a horizontal. 


Figura 5.5.2 


x 


x 



Podemos fazer este caso cair na situação anterior considerando uma mu¬ 
dança de base. Tomamos a base 0 - l^i■ e,} on ^ e e \ = (cosô, sen 9) está na 


direção de x' (espelho) e e 2 - (cos (\ + 9 ), sen (y + 9) = (-sen d, cosí; 


está na direção normal ao espelho. Em relação a esta base 
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Portanto, em relação à base canônica temos 



(verifique, calculando 


«e ■ «L - 

e, portanto: 


20 sen 2 6 
sen 20 -cos 20 


c _ cos 26 sen 28 a 
d\ L scn 26 -cos 2 6 b 


A matriz poderia ser obtida diretamente simplesmente observando 

o que a transformação linear (o espelho) faz nos vetores da base canônica 
(raios luminosos na direção do eixo dos x e dos y). (Veja a Figura 5.5.3.) 



Note que ao colocarmos as componentes dos vetores refletidos em coluna 
obteremos a mesma matriz que antes. 

Como podemos tratar o problema em que hajam vários espelhos e, con- 
seqüentemente, reflexões sucessivas? Simplesmente pela composição das trans¬ 
formações lineares associadas a cada espelho na ordem em que ocorrem as 
reflexões ou, em termos de matriz, pelo produto das matrizes na ordem 
correta (veja 5.4.6). 

Vamos exemplificar analisando a situação seguinte: um feixe de luz se 
propagando na direção do vetor (1, -1) e refletindo nos espelhos da figura: 



Em que direção estará o feixe após as reflexões? 
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Para responder a isto basta utilizar a matriz de 5.5.1 com 0 - 6 para a 
primeira reflexão eí = y para a segunda. Temos então (verifique): 


,. - , ,-l+V3 1 

Concluímos, então, que o feixe estara na direção de ( 2 1 2 

O mesmo raciocínio poderá ser feito quando estamos com espelhos planos 
no espaço. Façamos um exemplo. Vamos mostrar que se tivermos 3 espelhos 
colocados dois a dois perpendiculares, qualquer feixe de luz de raios paralelos 
que incide sobre o conjunto sairá paralelo à direção de incidência após as refle¬ 
xões (veja a Figura 5.5.4). 

Figura 5.5.4 



c 


1 

-rf 

fi 

v/l" 


i 




2 

2 

2 

2 






-v/l 

-1 

n 





d 


2 

2 

2 

2 _ 


_-i_ 



As matrizes associadas a cada espelho podem ser obtidas observando o que ele 
faz com cada um dos vetores da base canônica. Obtemos então. 



-1 

0 

0 


" 1 

0 

0 


1 

0 

0 

M, = 

0 

1 

0 

, Mj = 

0 

-1 

0 

, Mj = 

0 

1 

0 

.0 

0 

1_ 


0 

0 

1 


0 

0 

-1 


para os espelhos I, II e íll respectivamente (verifique). Se o feixe de luz 
incidente está na direção {a, b, c) a direção do feixe refletido pelo conjunto 
será 


'cT 

e 

= M 3 • M 2 • Mi» 

' a " 
b 



c 



O mesmo resultado será obtido se as reflexões se derem em outra ordem 
(M 2 M 3 Mj, MiM 2 M 3 etc.). Podemos concluir, portanto, que a direção de saída 
é paralela e contrária à de entrada. 

A reflexão da luz (ou som) feita em espelhos não planos não é descrita 
por transformações lineares. Você verá alguns exemplos de espelhos não planos 
em 11.7. Aguarde! 



5.6 EXERCÍCIOS 


1- Seja T: K-* W uma função. Mostre que: 

a) Se T é uma transformação linear, então r(0) = 0 

b) Se T(0) * 0, então T não é uma transformação linear. 


2. Determine quais das seguintes funções são aplicações lineares: 
tf)/:R 2 -»R 2 

(*. y)*+(x + y, X - y) 

b) g: R 2 +R 

( x. y) xy 

c) h :M 2 -*• R 


a b 

L . v /A 

a b 

c d 

f > uei 

c d 


d) k:P 2 -*P i 

ax 2 + bx + c i-► ax 3 + bx 2 + cx 

e) M: R 3 -*■ R 2 


(x, y, z) i-> (x, y, z) 


1 

0 

1 


2 

-1 

1 


f) N: R->R 
jch-IjtI 


3. a) Ache a transformação linear T:R 3 ->■ R 2 tal que T{\, 0, 0) = (2, 0), 

7X0, 1, 0) = (1, 1) e T(0, 0, 1) = (0, -1). 
b) Encontre v de R 3 tal que 7'(v) = (3, 2). 

4. a) Qual é a transformação linear 7:R 2 ^R 3 tal que 7’(1, 1) = ( 3 ( 2, 1) e 

7X0, -2) = (0, 1, 0)? 

b) Ache 7X1, 0) e T{ 0, 1). 

c) Qual é a transformação linear S: R 3 -► R 2 tal que S(3, 2, 1) = (1, 1), 

5(0, 1,0) = (0, -2) e 5(0, 0, 1) = (0, 0)? 

d) Ache a transformação linear /^R 2 -*• R 2 tal que P ~ S c T. 

5. a) Ache a transformação T do plano no plano que é uma reflexão em torno 

da reta x = y. 

b) Escreva-a em forma matricial. 

6 . No plano, uma rotação anti-horária de 45° é seguida por uma dilatação de 
v2. Ache a aplicação A que representa esta transformação do plano. 
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7 . Qual é a aplicação A que representa uma contração de jj seguida por 
uma rotação horária de 45 o ? 

8 . Verifique qual o núcleo è imagem e suas respectivas dimensões das transfor¬ 
mações dadas nos exemplos do parágrafo 5.1. 

9 . Dados T.U-+ V linear e injetora e u,, u 2 , ..., ut, vetores LI em U , mostre 
que {r(ui), •••> 7X U *)} ® LI. 

10. Sejam R, S e T três transformações lineares de R 3 em R 3 . 

' 1 0 1 ' 

Se [R ] = 2 1 1 e 

0-1 1 


‘-2 1 -1 ‘ 

[ 5 ] = 3 1 2 , ache 

1 -2 0 


T tal que R = S°T. 

n. Sejam . - «1, -D. (0, 2)} e f . «1. 0. -1). (0, 1, 2), 0. 2, 0)} ba.es de 

R 2 e R 3 respectivamente e 

' 1 0 ' 

[T Ç = 1 1 

1.0 -1 

a) Ache T. 

b) Se S(x, y) = (2 y, x - y, x), ache [SJ£. 

[ 1 O' 

c) Ache uma base y de R 3 tal que [T]^ = 0 0 

12. Se [R] = 3 e [S] = \ 1 > ache R ° S ’ 

13. Se R{x, y) = (2x, x - y, y) e S(x, y, z) = (y - 2 , z - x), 

a) Ache jRoS], 

b) Ache [5o/?]. 
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14. Seja V o espaço vetorial de matrizes 2X2 com base 



0 1 
0 0 


0 0 ] [0 0 11 
1 oj, [o 1 Jf 


Se T: V - R 2 é dada por T | “ * J = (a + d, b + c), 

a) Ache [Tf a onde a é a base canônica de R 2 . 

'2 1 

SeS:R 2 - V e [Sjg = J ’’ 

. 0 1 

b) Ache S e, se for possível, (a, b) tal que S(a, b) = 


1 7 

15. Seja FiR 2 -► R 2 tal que [T] = Ache os vetores u, v tal que 

u i j 

a) r(u) = u 

b) T(\) = -v 

16. Mostre que se T: V-* W é uma transformação linear, 

a) Im(T) é um subespaço de W. 

b) ker(T) é um subespaço de V. 


17. Sejam S c T aplicações lineares de V em W. Definimos S + T como 

(S + T)\ = ^(v) + T(y) para todo v E V e definimos aS como (a5)v = 

= a • £(v) para todo a € R e v E V. 

a) Mostre que S + T é uma transformação linear de V em W. 

b) Mostre que aS é uma transformação linear de V em W. 

c) Mostre que X - {T ) T: W} é um espaço vetorial sobre R. 

d) Suponha que dim V = 2 e dim W = 3. Tente procurar áimX. 

18. No Exercício 11 determine ker T y Im T y Im S y ker S e comprove a validade 
dos teoremas 5,3.9 e 5.4.5 para estas transformações. 

19. Considere a transformação linear 

r;R 3 ->R 3 dada por T{x, y> z) = (z, x-y, - z). 

a) Determine uma base do núcleo de 7\ 

b) Dê a dimensão da imagem de T. 

c) T é sobrejetora? Justifique. 

d) Faça um esboço de ker T e ImT. ciência & ilcnoVgia 

UFPe! 
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20. Dê, quando possível, exemplos de transformações lineares T, S, L, M e H 
satisfazendo: 

a) T : R 3 -+ R 2 sobrejetora 

b) S :R 3 -*■ R 2 , com ker S = {(0, 0, 0)} 

c) L : R 3 -*■ R 2 , com lm L =J(0, 0)} 

c/)AÍ:R 2 -*■ R 2 , com kerM= {(x, y) € R 2 ; x = y} 

e) H: R 3 -* R 3 , com ker H = {(x, y, z) e R 3 ; z = -x} 


21. Seja Pi - conjunto dos polinómios com grau menor ou igual a 3, e 

T:P 3 -i> 3 

f -*f‘ (derivada) 

a) Mostre que P 3 é um espaço vetorial de dimensão 4. 

b) Mostre que T é uma transformação linear. 

c) Determine ker T e ImT e encontre uma base para cada um destes 
subespaços vetoriais. 


22. Seja D .P 3 P 3 

fv+f" (derivada segunda) 

Mostre que D é linear e determine uma base para ker D. 


23. Sejam a = {(0, 2), (2, -1)} e P = {(1, 1, 0), (0, 0, -1), (1, 0, 1)} bases 
de R 2 e R 3 . 



0 

0 

-4 


Dê a expressão para S(x, y). 


24. Seja 



[o 

f 


"o 

o 

o 

_I 

A = 

1 

O O 

2 

1 

B = 

Li 

2 1 

0 °. 


Encontre ker T Á . ImT Á . kerT B , lm T B ,ker {T R oTJ Im(T B oT A ). Determi 
ne bases para estes seis subespaços. 



25. Seja T : R 2 -> R 2 uma reflexão, através da reta^ = 
a) Encontre 7X*, y ). 


b) Encontre a base ade R 2 , tal que [T\* = 


1 

0 


0 


26. Seja T : R 3 -»• R 3 onde T(v) é a projeção do vetor v no plano 
3x + 2y + z = 0. 

a) Encontre Tíx, y, z). 

b) Encontre uma base ordenada P de R 3 , tal que 

1 0 0 

0 0 0 

0 0 1 



27. Seja L : R 3 -*■ R 3 onde L é a reflexão através do plano 
3x + 2y + z = 0. 

a) Encontre L(x, y, z). 


b) Encontre uma base ordenada y de R 3 , tal que 


[T] y y = 


0 0 

1 0 

0 -1 


28. Encontre a expressão da transformação linear T: R 3 -* R 3 q U e é uma 
rotação de jr/3 em tomo da reta que passa pela origem e tem a direção 
do vetor (1, 1, 0). 


*29. Um espelho plano está apoiado em uma parede vertical formando um ân¬ 
gulo de 30° com ela. Se um feixe de luz de raios paralelos for emitido ver¬ 
ticalmente (do teto para o chão) determine a direção dos raios refletidos. 
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*30. Um espelho plano triangular é apoiado no canto de uma sala da forma des¬ 
crita na figura abaixo. 



Em que direção será refletido um feixe de luz de raios paralelos emitidos 
verticalmente de cima para baixo? 


5.6.1 Respostas 

3. a) T(x. y, z) = (2x + y, y - z) 
b) v = (x, 3 - 2x, 1 - 2x) 

5. a) T(x, y) = (y, x) 





19. a) ker T = [(1, 1,0)] base = {(1, 1,0)} 

b) dim Im T - 3 - dim ker T = 2 Veja (5.3.9). 

c) Não. dim Im T - 2. 
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21 . a) (Veja Exemplo 4 de 4.2.2) base deste espaço: fl x x 3 jr 3 } 

b ) (Veja Exemplo 5 de 5.1.2) 

c) ker T = {P(x) = k (constante)} base: {1} 

ImT = {/**) = ax 2 + bx + c, a, b, c e R} base: (1, jc, x 1 } 

23. 5(x,^) = (v -- j X , y +Y’ ~ 3 x ~ 2 y)- 

24. kerT B = {x, y, z) £ R 3 ; x = 0 e z = 2y) base: (0, 1,-2)} 

Im T g = [(0, 1,0), (0, 1,-1)] base: {(0, 1,0), (0,1, -1)} 
kerT A = [(1,0)] Im T À = [(1,2, 1)] 

kerT B OT A = K 1 ’ 0 )! Im T B ° T A = 1(0,0, 1)] 

25. a) T (x, y) = ~(~ 4x + 3y, 3x - 4 y) 

b) a pode ser qualquer base (v,, v 2 } tal que v, pertença à reta e v, e v 2 sejam 
perpendiculares, por exemplo, a = {(1, 3), (-3, 1)} 

27. a)T(x,y,z ) = -y- (- 2x - 6y - 3z,-6x + 3y - 2z, ~3x - 2y + 6z) 

b ) 7 P ode ser qualquer base (v lf v 2 , v 3 }do R 3 tal que v, e v 2 pertençam 
ao plano e v 3 seja normal ao plano dado. Por exemplo, y = {(10-3) 

(0, 1,-2), (3,2, 1)}. ’ ’ * 


Leituras Sugeridas e Referências 

*Gelfand, I. M.; Lectures in Linear Álgebra ; Interscience Publishers, New York, 1961 
Hoffman, JC. e JCunze, R ; Álgebra Linear ; Fditora Polígono, Sâo Paulo, 1971. 


Biblioteca de \ \ 
Ciência & Tecnolagl 

UFPel 



Autovalores e Autovetores 179 



AUTOVALORES E 
AUTOVETORES 


6.1 INTRODUÇÃO 

Dada uma transformação linear de um espaço vetorial nele mesmo, T : K-» V 
gostaríamos de saber que vetores seriam levados neles mesmos por esta trans¬ 
formação. Isto é, dada T:V-*V, quais são os vetores v e V tais que T(y) = 

_ v? (v é chamado vetor fixo). Tentaremos elucidar esta questão, considerando 
algumas transformações que já foram estudadas no capitulo anterior. 


6.1.1 Exemplos 


(x,_y)> para todo (x, _y)GR 2 . 

Exemplo 2: 

r x :R 2 ^ R 2 (Reflexão no eixo-x) 

(x, y ) H- (x, -y ) ou 


Exemplo 1: 

I: R 2 -vR 2 (Aplicação identidade) 

(*,}') h- (x, >0 

Neste caso, todo R 2 é fixo uma vez que I(x, y) = 



X 


i 

(f 

X 

y 


0 

-1 

y 


Geometricamente 




Intuitivamente podemos notar que todo vetor pertencente ao eixo-x é mantido 
fixo pela transformação r x . De fato: 


" i 

o’ 

M 


X 

0 

-1 

0 i 

L j 


_0 


ou seja, r x (x, 0) = (x, 0). 

Ainda mais, estes vetores são os únicos com esta propriedade, visto que, 
procurando vetores !~*1 tais que 


1 

o" 

- 

X 


X 

0 

-1 

J. 


y m 


caímos no seguinte sistema: 

j x + Qy = x 
1 0x - y = y 


f X = X 

l~y = y 

As únicas soluções deste sistema são vetores do tipo (x, 0), ou seja. são os 
vetores pertencentes ao eixo-x. 
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Exemplo 3: 

N: R 2 -+ R 2 (Aplicação nula) 

(*,.y)^(0, 0) 

Neste caso, o único vetor que é fixo pela aplicação dada é o vetor nulo, 

N(0, 0) = (0, 0). 

Passaremos agora para o seguinte problema: Dada uma transformação 
linear de um espaço vetorial T\VV, estamos interessados em saber quais 
vetores são levados em um múltiplo de si mesmo; isto é, procuramos um ve¬ 
tor v E V e um escalar X E R tais que 

r(v) = Xv 

Neste caso ÍT(v) será um vetor de mesma “direção” que v. Por vetores de mes¬ 
ma “direção” estaremos entendendo vetores sobre a mesma reta suporte. 

Como v = 0 satisfaz a equação para todo X, estaremos interessados em 
determinar vetores v ^ 0 satisfazendo a condição acima. O escalar X será cha¬ 
mado autovalor ou valor característico de T e o vetor v um autovetor ou ve¬ 
tor característico de T. Vamos formalizar este conceito. 

Passaremos doravante a dar a designação usual de operador linear para 
uma transformação linear T\V^ V (de um espaço vetorial nele mesmo). 

6.1.2 Definição: Seja T:V -► V um operador linear. Se existirem v E F, 
v ^ 0, e X E R tais que TV = Xv, X é um autovalor de T e v um autovetor 
de T associado a X. 

Observe que X pode ser o número 0, embora v não possa ser o vetor 
nulo. Daremos a seguir exemplos de como calcular autovalores e autovetores, 
usando a definição. 


6.1.3 Eremplos 

Exemplo 1 : 

T: R 2 -> R 2 
VH> 2v 





Neste caso, 2 é um autovalor de T e qualquer (x, y) ^ (0, 0) é um autovetor 
de T associado ao autovalor 2. Observe geometricamente: 
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De um modo geral toda transformação 

7\ R 2 -» R 2 
v av, a ^ 0 

tem a como autovalor e qualquer (x, v) =£ (0, 0) como autovetor corresponden¬ 
te. Observe que 7\v) é sempre um vetor de mesma direção que v. Ainda mais, 
se: 

i) a < 0, T inverte o sentido do vetor. 

ii) | a | > 1, T dilata o vetor. 

iii) | a | < 1, T contrai o vetor. 

iv) a = 1, Té a identidade. 

Exemplo 2: 

r x :R 2 R 2 (Reflexão no eixo-x) 

(x, -y) 



Os vetores da forma 



são tais que 



Assim, todo vetor (0, y), y i= 0, é autovetor de r x com autovalor X = -1. 
Como já vimos no Exemplo 2 da seção 6.1.1 os vetores (x, 0) são fixos por 
esta transformação, ^(x, 0) = 1(*, 0), ou seja, (x, 0) são autovetores corres¬ 
pondentes ao autovalor 1. 
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v 


r x 


u 


r x (u) = u 


r x {v) - -v 


Figura 6.1.3 


Exemplo 3\ 

T:R 2 -> R 2 (Rotação de 90° em torno da origem) 
(x, y ) w (- y, x ) 


r*i 


o 

i 

1- 

| X 


-y 

'sí 

■ 

-> 

o 

1- 

1 

11 

X 


Note que nenhum vetor diferente de zero é levado por T num múltiplo de si 
mesmo. Logo, T não tem nem autovalores nem autovetores. 

Este é um exemplo de que nem todo operador linear possui autovalores 
e autovetores. Este fato será comentado melhor posteriormente (veja o Exemplo 
2 de 6.2.2) 

Exemplo 4 : 


Seja A = 


2x + 2y 

y 

e r A (*, y) = (2x + 2 y, y). 

Para procurar os autovetores e autovalores de 4 resolvemos a equação 
4(v) = Xv ou 


Então A 


X 


" 2 2" 

X 


_y_ 


0 1 

s. 



[2 2 
0 l] 


Xx 
\y 

Assim, temos o sistema de equações 


2x + 2y 

y 


= X 



4 2 * + 2y = Xx 
y =\y 

Consideremos os casos quando i) y 0 e ü) y - 0. 

0 Se y jz 0, então da segunda equação X = 1 . 

Logo 2x + 2y = x e y = - ^ x. Obtemos assim, para o autovalor 

X = 1 , os autovetores do tipo (x, - ~ x), x ^ 0. Em outras palavras, 

como T(x , x) - 1 (x, os vetores sobre a reta x = - 2 y são 

mantidos fixos pela transformação T. 

ii) Se y = 0, x deve ser diferente de 0, pois senão o autovalor (x, y) seria 
nulo, o que não pode acontecer pela definição de autovetor. Da primei¬ 
ra equação, 2x + 0 = Xx ou X = 2 . Portanto, outro autovalor é 2 e qual¬ 
quer vetor não nulo (. x, 0 ) é um autovetor correspondente. Então, todos 
os vetores sobre o eixo-x são levados em vetores de mesma direção’ 

T(x f 0 ) = (2x, 0) ou 7Tv) = 2v. 

Temos assim, para esta transformação 7\ autovetores ( x, - — x), 

x 0 , associados ao autovalor 1 e autovetores (x, 0 ), x ^ 0 , associados ao 
autovalor 2 . Todos os outros vetores do plano são levados por T em ve¬ 
tores de direções diferentes. 

6.1.4 Teorema: Dada uma transformação T:V^ V e um autovetor v 
associado a um autovalor X, qualquer vetor w = a\ (a 0) também é autove¬ 
tor de T associado a X. 

Observe isto nos exemplos e mostre que em geral isto é válido. Mais 
ainda, mostre que o conjunto formado pelos autovetores associados a um auto¬ 
valor X e o vetor nulo é um subespaço vetorial de V, isto é, = 

= {v E V:T(v) = Xv} é subespaço de V. (Veja o Exercício 20 da secção 6.3). 
Vamos dar um nome a este subespaço. 

6.1.5 Definição: O subespaço = ( v € V\l\y) = Xv} é chamado o 
subespaço associado ao autovalor X. 

As noções de autovetor e autovalor de uma transformação linear (ou 
matriz) são fundamentais por exemplo em Física Atômica porque os níveis de 
energia dos átomos e moléculas são dados por autovalores de determinadas ma¬ 
trizes. Também o estudo dos fenômenos de vibração, análise de estabilidade de 
um avião e muitos outros problemas de Física levam á procura de autovalores e 
autovetores de matrizes. 
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No Capítulo 12 você terá uma idéia de como as noções de espaço veto¬ 
rial autovalores e autovetores são utilizadas na resolução de sistemas de equa¬ 
ções diferenciais, e muitas situações físicas são descritas por um sistema de 
equações diferenciais. (Veja o Exemplo 3 de 12.2.1 e os Exe,rcrcios; de 12AJ 
Outra aplicação importante que estamos visando e a classificaçao 
cas e quádncas que será vista no Capítulo 11. Nela, autovalores e autovetores 
serão usados para '•normalizar” formas quadráticas. Mais especificament 
serão usados para encontrar mudanças de referencial que permitam ídentmc 
quais as figuras geométricas que representam certas equações no plano e no 

espaço. 

6.1.6 Autovalores e Autovetores de uma Matriz 

Dada uma matriz quadrada, A, de ordem n, estaremos entendendo por 
autovalor e autovetor de A autovalor e autovetor da transformaçao linear 
j r" _>r” associada à matriz A em relação à base canónica isto e, 

Za(v) = A • v forma coluna). Assim, um autovalor X £ R de A, e um 
autovetor v E R", são soluções da equaçao A • v = Xv, v ± 0. 

Exemplo: Dada a matriz diagonal 



e dados os vetores ei = (1, 0, ..., 0), e 2 - (0, 1, 0, — > •"> e ” 

= (0, 0, ..., 0, 1), temos 


A • e ( 


fl u 

0 

= <a,,e, e em geral. 


0 


A . e,- = (1/,-e/. Então, estes vetores da base canônica de R" são autovetores 
para A, e o autovetor e, é associado ao autovalor fl,-,-. 


Veremos na próxima secção que dada uma transformaçao linear 
T-V-* Ve fixada uma base 0 podemos reduzir o problema de encontrar 
autovalores e autovetores para T à determinação de autovalores para a matnz 

K 
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6.2 POLINÕMIO CARACTERÍSTICO 

Observamos nos exemplos da seção anterior que se nos basearmos nas defini¬ 
ções de autovalor e autovetor, para efetuar os cálculos que determinam seus 
valores, estaremos adotando um procedimento muito complicado. Por isto va¬ 
mos procurar um método prático para encontrar autovalores e autovetores de 
uma matriz real A de ordem n. Faremos um exemplo para o caso em que 
n = 3, e em seguida generalizaremos para n qualquer. 

Exemplo: 


Procuramos vetores v 6 R 3 e escalares X E R tais que A • v = Xv. Observe 
que se I for a matriz identidade de ordem 3, então a equação acima pode ser 
escrita na forma Av = (XI)v, ou ainda, (A - Xl)v = 0. 

Escrevendo explicitamente 

4 2 ol J~X 0 oT\M [o 

-1 1 0 - 0 X 0 ] J = 0 

0 1 2 J L° 0 x J/ L z j L° 

Temos então a seguinte equação matricial: 

4 - X 2 0 1M To 

-1 1-X 0 y = 0 

_ 0 1 2 - X J [_z J 0 _ 

Se escrevermos explicitamente o sistema de equações lineares equivalente a esta 
equação matricial, iremos obter um sistema de trés equações e três incógnitas. 
Se o determinante da matriz dos coeficientes for diferente de zero, saberemos 
que este sistema tem uma única solução, que é a solução nula, ou seja x = 

= y = z = 0. (Veja a observação final de 3.7.2.) Mas estamos interessados em 
calcular os autovetores de A, isto é, vetores v ^ 0, tais que (A - M)v = 0. 
Neste caso det(A - XI) deve ser zero, ou seja 

4 - X 2 0 

-1 1-X 0 =0 

0 1 2 - X 
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E P °'v"L'qJd 7 .’í(A -To'* um = poiinòmio e m X. E s te polinómio é ctam.- 
do o polinómio característico de A. Continuando a resolução, temos 

^ Loco X = 2 e X = 3 são as raízes do polinómio característico de A, e 
portanto os autovalores da matriz A são 2 e 3. Conhecendo os aut °^ °^ eS 
podemos encontrar os autovetores correspondentes. Resolvendo a eq ç 
Av = Xv, para os casos: 

0 X = 2 

4 2 olfxl M Ux + 2 y = 2 x 

-i 1 0 y = 2 * . ~\ x * y y ^ z \í 

0 1 2 Jl z J L z J l y 

A terceira equação implica que y = 0 e por isso vemos na segun^que^^ 
x = 0. Como nenhuma equação impoe uma restrição em , besDaC0 

associados a X = 2 são do tipo (0, 0, x), ou seja, pertencem ao subespaç 

[(0, 0, 1)]. 

//) X = 3 

Resolvendo a equação Av = 3v, temos 

"4.x + 2 y - 3- x 

* -jc + y = 

L y + 2z = 3z 

Tanto da primeira equação quanto da segunda vemos que x = -2y e da 
terceira vem z = y. Os autovetores associados ao autovalor X = 3 sao d 
tipo (-2 y, y, >0, ou seja, pertencem ao subespaço l( 2, 1, UJ- 

621 O que fizemos nesle exemplo com uma matriz A de ordem 3, po- 
de ser genèralimdo. Seja A uma matriz de o, dem n. Quais são os autovalores 
e autovetores correspondentes de A? São exatamente aqueles que 
equação Av = X, ou A. . (Xl)v ou ainda (A - XI). - 0. Escrevendo esta 

equação explicitamente, temos 

Escrevendo esta equação explicitamente, temos 

tf 11 " X tf 12 

tf21 ü 22 

tf«l a n2 
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Chamemos de B a primeira matriz acima. Então B • v = 0. Se detB 0, sa¬ 
bemos que o posto da matriz B é n e portanto o sistema de equações lineares 
homogêneo indicado acima tem uma única solução. Ora, como x j = x 2 = ... = 

= * n = 0 (ou v = 0) sempre é solução de um sistema homogêneo, então esta 
única solução seria a nula. Assim, a única maneira de encontrarmos autoveto¬ 
res v (soluções não nulas da equação acima) é termos detB = 0, ou seja, 

det(A - XI) = 0. 

Impondo esta condição determinamos primeiramente os autovalores X que 
satisfazem a equação e depois os autovetores a eles associados. Observamos que 

tf ii - X ... a ln 
P(\) = det(A - XI) = det . 

a n 1 *•* a nn 

é um polinómio em X de grau n. 

P(X) = (tfn - X) ... (a nn - X) + termos de grau < n f e os autovalores 
procurados são as raizes deste polinómio. P(X) é chamado polinómio caracterís¬ 
tico da matriz A. 

Consideremos mais alguns exemplos para fixar melhor o processo envol¬ 
vido no cálculo de autovalores e autovetores através do polinómio caracterís¬ 
tico. 

6.2.2 Exemplos 

Exemplo 1: 

A = 


det (A - XI) = det 

= (-3 - X) (2 - X) +4 
= X 2 + X - 2 = P(X). 

P{X) = 0 => (X - 1) (X + 2) = 0 ou X=1 ou X = - 2. 

Então os autovalores de A são I e -2. Procuramos agora os autovetores asso- 
ciados. 



Biblioteca de 
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«) X = 1 
Temos 


Logo 



-3x + 4 y _ x f -4x + 4y = 0 

-x + 2y ~ y ’ \ -x + y = 0 

Então, temos que x = y. 

Portanto os autovetores associados a X = 1 são os vetores v = (x, x), 
jc # 0. 

«) X = -2. 




-3x + 4y 
-x + 2y 



Então 


-x + 4y = 0 
-x + 4y = 0 


ou x = 4y. 


Os autovetores correspondentes ao autovalor X = -2 são da forma 
v = (4 y, y), y ± 0 (ou v = (x, -J-x)). 



Figura 6.2.1 


As retas acima são “invariantes” em relaçao a esta aplicação. 
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Exemplo 2: 


sTz -i 

1 ^3 


P(\) = det(A - XI) = det 


VT-X -1 

1 >/3-X 


= (V a ! - X) 2 + 1 
= X 2 - 2 nÁ3 X + 4. 

P(X) = 0 não admite raiz real (A = -4), logo a matriz A não admite autova¬ 
lores (nem autovetores). Isto significa que a transformação dada pela matriz A 
não preserva a direção de nenhum vetor. r A (v) =£ Xv> v ^ 0. 
Geometricamente, como 


V~3 -1 

1 v/3 


/~3 -J_ 

2 2 

-L 

2 2 


2 0 cos 30° -sen 30° 

0 2 sen 30° cos 30° , 


a transformação 7 A dada pela matriz A é uma rotação de 30° composta com uma 
dilatação. 

T a (x, y) = (V~3 x - y, x + \fz 

T A (1, 0) = (\Í3 , 1) e r A (0, 1) = (-1, y/3 )• 



Figura 6.2.2 
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6.2.3 Observação 

Observe que se estivéssemos trabalhando com um espaço vetorial complexo 
(isto é, os escalares são números complexos), o polinómio característico P{\) = 
- \ 2 - 2\Í3 X + 4 do exemplo anterior teria as raízes X = \TS + / e X = 

= >/3 - l Os autovetores encontrados, da mesma maneira que no caso real, 
são do tipo (x, -ix) e (x, ix) respectivamente. Assim, toda aplicação linear so¬ 
bre espaços vetoriais complexos sempre admite autovalores, uma vez que seu 
polinómio característico sempre admite raiz. Neste caso não se tem a visão 
geométrica de autovetor como vetor que tem sua direção preservada pelo ope- 
rador. Veremos no Capítulo 12 que autovalores e autovetores complexos apa¬ 
recem na resolução de um sistema de equações diferenciais, provindo de uma 
situação real. 

6.2.4 Vamos apresentar agora duas matrizes que têm o mesmo polinómio 
característico e, portanto, os mesmos autovalores, porém, com autovetores di¬ 
ferentes. Além disso, vamos resolver os sistemas de equações lineares que nos 
dão os autovetores usando matrizes escalonadas. 

6.2.5 Exemplos 

Exemplo 1 : 



3 

0 

-4 


3 - X 

0 

-4 

A = 

0 

0 

3 

0 

5 

-1 

e A - XI = 

0 

0 

3 -X 

0 

5 

-1 -X 


Então, jP(X) = dct(A - XI) = (3 - X) 2 (-1 - X). 
Os autovalores de A são X] =3 e X 2 = -1. 

/) Autovetores associados a Xt = 3 



3 

0 

-4 




X 


0 

3 

5 


y 

= 3 

y 


0 

0 

-1 


z 


z 

r 






f 

= 0 

\ 3x 

- 4z 

= 3x 


-4 z 


3 y + 5z 

= 3V 


5z 

= 0 



-z 

= 3z 


-4z 

= 0 


Matriz ampliada do sistema: 


0 

0 

-4 

0 


0 

0 

1 

ol 


0 

0 

1 

0 

0 

0 

5 

0 


0 

0 

5 

0 

— 

0 

0 

0 

0 


0 

-4 

0 


0 

0 

-4 

0 


0 

0 

0 

0 



A solução é: z = 0 e x, y quaisquer. 

Portanto os autovetores são do tipo v = (x t y 9 0). 

ii) Autovetores associados a X 2 = -1. 


1 

1 

o 


M 


M 

r 

0 3 5 

0 0-1 


■—i 

= -1 

r 

1_ 



3x -4z - -x 
3y - 5z = -y 
-z = -z 


4x - Az = 0 
4y - 5z = 0 
0 = 0 


Matriz ampliada do sistema: 


4 

0 

-4 

0 


1 

0 

-1 

0 


"l 

0 

-1 

0 

0 

4 

-5 

0 


0 

4 

-5 

0 


0 

1 

-5 

0 

0 

0 

0 

0 


0 

0 

0 

0 


4 












0 

0 

0 

0 


x - z = 0 

< y -j z = 0 

0z = 0 


Solução: x = z, y - z y z qualquer. 

Os autovetores são do tipo v = (z,— z, z), z =£ Q. 


Exemplo 2: 



-4 

5 

-1 


m - 


3 -X 
0 
0 


-3 

3 -X 
0 


-4 

5 

-1 -X 


= (3 - X) 2 (-1 - X). 


Observe que este polinómio é o mesmo que o do exemplo anterior. Então os 
autovalores são Xi =3 e X 2 = -1. 
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6.2.6 Nesta secção definimos polinómio característico de uma matriz, 
ou seja, da transformação linear 7: R" -> R* a e j a associada como em 6.1.6. 

Podemos estender este conceito para qualquer transformação linear 
T:V-* V, partindo do seguinte argumento. 

Seja P uma base de V, então temos as equivalências: 


Tv = \v <=> 






det ([rÇ - X/ ) = o 


Observamos que a última condição é dada por P(X) = 0 onde P(X) é o poli¬ 
nómio característico da matriz [T]$ conforme o conceito dado em 6.2.1. 

Neste caso P{\) também será chamado polinómio característico da transforma¬ 
ção T e suas raízes serão os autovalores de T. O fator fundamental nesta defi¬ 
nição é sua independência da base 0 escolhida. 

De fato, seja a uma outra base de V e A = [ 7]^ . Então (veja 5.4.10), 


det (l Tf a - XI) = det (/![ T]^ A' 1 -XA/A' 1 ) = det [X([ T]^ - XI) • A' 1 ] 
= det (A) • det ([ rf & - XI) - det (/T 1 ) = det (| T $ - XI) = P(X)- 


6.2.7 Exemplos 

Exemplo 1: Seja T: R 2 -> R 2 dada por 7\x, y) = (-3* + 4 y, -x + 2y). 
Procuremos seus autovalores e autovetores. Notemos que se a é a base canô¬ 
nica de R 2 

[rÇ = I] 2 portanto ’ 

podemos dar o polinómio característico de T como P(X) = det ([ 7]® - X/). 
Você pode agora concluir o exemplo copiando de 6.2.2 — Exemplo 1. 

Exemplo 2: Seja 7* o espaço vetorial dos polinómios reais de grau menor 
ou igual a um e seja T:P X ^P i a transformação linear que leva o polinómio 
1 + x em 5 + 2x e o polinómio 4 + x em -2 • (4 + x). Note que Wj - 1 + x e 
w 2 = 4 +jc são vetores LI, e portanto formam uma base a de P l e portanto 
T está bem definida. Observe ainda que 71(wi) = w t + w 2 e 7(w 2 ) = -2w 2 . 
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Portanto [T\* = j • 

0 polinómio característico é JP(X) = (1 -X)(-2-X) e os autovalores serão, por¬ 
tanto, X* = 1 e X 2 = -2. Calculemos os autovetores associados: 

0 [T]* • [v] a = l[v] a o que implica [v] a = e R 

I‘0 [v] a = -2[v] a o que implica [v] a = ^ ^ E R 

Assim, os aut ove t ores associados a Xi = 1 são da forma 
v = awi + 3aw 2 ~ 13a + 4ax, Va 
Ainda, os autovetores associados a X 2 = -2 são da forma 
v = 0 • Wj + 6w 2 = 4 b + bx 

6.2.8 Vamos aproveitar os exemplos de 6.2.5 para introduzir o conceito 
de multiplicidade de um autovalor. Chamamos de multiplicidade algébrica de 
um autovalor a quantidade de vezes que ele aparece como raiz do polinómio 
característico. No Exemplo 1 de 6.2.5 o autovalor Xi = 3 tem multiplicidade 
algébrica igual a 2. (Ou ainda, 3 é uma raiz dupla do polinómio característico.) 

No Exemplo 2 o autovalor Xi ^3 tem multiplicidade algébrica 2. 

Observe que no Exemplo 1 encontramos para o autovalor Xi = 3 autove¬ 
tores do tipo v = (x, y, 0). Note que {(x, y> 0) € R 3 ; x, y € R} = 

= {x( 1, 0, 0) + y{ 0, 1, 0) :x, y e R] = [(1, 0, 0), (0, 1, 0)] e portanto a 
dimensão deste subespaço associado ao autovalor Xi = 3 é 2 (dois vetores LI). 
Neste caso dizemos que a multiplicidade geométrica de Xi = 3 é 2. Mais pre¬ 
cisamente, a multiplicidade geométrica de um autovalor X é a dimensão do 
subespaço de autovetores associados a X. No Exemplo 2, o auto¬ 
valor X, = 3 tem multiplicidade geométrica 1, visto que a dimensão de 
{(x, 0, 0); x E R} = {x(l, 0, 0); x E R) = [(l y 0, 0)] é 1. Observe ainda 
que se a multiplicidade algébrica de um autovalor for 1, a multiplicidade geo¬ 
métrica será necessariamente igual a 1. 

6.3 EXERCfCIOS 

1. Seja T : R 2 -► R 2 

(*, y)*+(y> 2>>). 

Mostre que X = 2 é um autovalor de T e vetores da forma (x, 2x) são os 
autovetores correspondentes. 
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Ache os autovalores e autovetores correspondentes das transformações linea¬ 
res dadas: 

2. T : R 2 -*► R 2 tal que T(x, y) (2 \y i x) 

3. T: R 2 -» R 2 tal que T(x, y) ^ ( x + y< 2x ■¥ y) 

4. P R 3 ^R 3 tal que (x, y, z)» (x + y, x-y + 2z, 2 x+y-z) 

5. T :P 2 ^-P 2 tal que T(ax 2 + bx + c) = ax 2 + cx + b 

6. T:\i 2 -+M 2 tal que An-A' (Isto é, T é a transformação que leva uma 
matriz na sua transposta.) 

7. T : R 4 -* R 4 tal que T(x, y, z, \v) = (x, x + y, x +y + z, x +y + z + w) 
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19. Seja À = 


-1 

0 

J 


-2 

-1 

0 


0 

1 

0 


. Quais são os autovalores e autovetores de A de 


um espaço vetorial: 

a) Real b) Complexo 


20. Se X é autovalor da transformação linear T : V V e v é um autovetor asso¬ 
ciado a ele, mostre que 

a) k\ é outro autovetor associado a X se k ^ 0. 

b ) O conjunto formado pelos autovetores associados a X e o vetor nulo é 
subespaço de V. 

21. Suponha que \ l e X 2 sejam autovalores distintos e diferentes de zero de 
T : R 2 R 2 . Mostre que 

a) Os autovetores V] e v 2 correspondentes são LI. 

b) 7T(vi) e 7Xy 2 ) são LI. 


22. Seja A = 



a) Ache os autovalores de A e de A 1 
h) Quais são os autovetores correspondentes? 


23. Suponha que X seja autovalor de T:V-+V com autovetor v e oc um número 
não nulo. Ache os autovalores e autovetores de otT . 


24. Suponha que v E V seja autovetor de T: V -► V e 5: VV, ao mesmo 
tempo com autovalores Xi e X 2 respectivamente. Ache autovetores e auto¬ 
valores de 

a) S + T b) SoT. 


25. Seja T:V~* V linear 

a) Se X = 0 é autovalor de T , mostre que T não é injetora. 

b) A recíproca é verdadeira? Ou seja, se T não é injetora, X = 0 é autova¬ 
lor de T? 


26. Sejam A - 


1 

2 

1 


1 

3 

1 

0 

-1 

1 

e B = 

0 

2 

0 

0 

_ 

0 

-1 


0 

1 

O 


matrizes inversíveis. 

a) Calcule AB e BA e observe que estes produtos são distintos. 

b) Encontre os autovalores de AB e os de BA. O que você observa? 



c) Encontre os autovetores de AB e os de BA. O que você nota? 

d) Motivado pelos itens anteriores, mostre que: se A e B são matrizes in¬ 
versíveis de mesma ordem, os autovalores de AB e BA são os mesmos. 
Mostre mais ainda: se X I é um autovalor de AB com autovetor v, então 
Xj é autovalor de BA com autovetor Bv. Da mesma forma, se X 2 é um 
autovalor de BA com autovetor w, então X 2 é autovalor de AB com 
autovetor Aw. 


6.3.1 Respostas 

3. Ai = 1 + y/2, v, = (x, X 2 = \-yJl,y 2 = (x,-\/2x) 

5. X = 1, v = ax 2 + bx + b 

7. X = 1, v = (0, 0, 0, w) 

8 . T(x, y) = (- 6 y, -x +y) 

9. X, = 1, v, = (x, 0); X 2 = -1, v 2 = (-y, y) 

11. X = 1, v = (x, 0, 0) 

13. Xj = 1 , V| = (-y, y> 0)', X 2 = -1 , v 2 = (jc, 2x, -x), Xj = 3, V 3 = (x, 0, x ) 

16. Xi - 4, v, = (y - z, y, z); X 2 = -2, v 2 = (x, 0, x) ou Xj = 4, 

V, = ( y, y, 0); X 2 = 4, v 2 = (-z, 0, z); X 3 = -2, v 3 = (x, 0, x) 

17. X, = -3, v, = (2 y - 7z, y, z); X 2 = 9, v 2 = (x, x, x) 

18. X, = 1, V! = (0, y, 0, -y)\ X 2 = -1. v 2 = (x, 0, -2x, 0); X 3 = 6, 
v 3 = (x, 0, 4x, 0) 

19. à) X = -2, v =• (2x, x, -x) 

b) X, = -2, v, = (2x, x, -x); X 2 = i, v 2 = [(-1 + í)y, y, (1 + i)y\\ 

x 3 = -i. v 3 = [(-1 - o y. y, 0 - 0y] 

22. a) Os de A são -1 e 2; os de A' 1 , -1 e|, 

b) Os de B são (-2y, y) e (x, 2x); os de A’ 1 , (-2 y, y) e (x, x) 

23. Autovalor a\ com autovetor v. 


198 


ÁLGEBRA LINEAR 


25. a) Como X = 0 é autovalor, existe v-# 0 tal que 7v = 0 • v = 0. 

Então TO = 0 e 7V = 0. Portanto, T não é ínjetora. 

b) Como T não é injetora, existe v w tal que 7V = 7W. 

Então 7V - Tw = 7Tv - w) = 0 = 0 ■ (v - w). Portanto, 0 é autovalor 
de T com autovetor v - w. 

26. b ) São iguais. Xi = 1, X 2 = -2, X 3 = -3 

c) São diferentes. Vi = (jc, 0, 0), v 2 = ( y y> y> 0), v 3 =(|z, -2z, z) 
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DIAGONALIZAÇÃO DE 
OPERADORES 


No Capítulo 5 foram introduzidas as aplicações lineares e as matrizes a elas 
associadas. Nosso objetivo neste capítulo será encontrar uma base do espaço 
vetorial na qual a matriz de um determinado operador linear seja a mais sim¬ 
ples possível. É fácil deduzir as conveniências práticas de se trabalhar com os 
operadores, usando tais matrizes. Por muitos motivos, como você verá, a me¬ 
lhor situação possível é aquela em que conseguimos uma matriz diagonal asso¬ 
ciada a um operador. 


7.1 BASE DE AUTOVETORES 

Dado um operador linear T : V -+ V, nosso objetivo é conseguir uma base 0 de 
V na qual a matriz do operador nesta base ([T]p seja uma matriz diagonal, 

que é a forma mais simples possível de se representar um operador. Observe¬ 
mos inicialmente a seguinte propriedade dos autovetores. 

7.1.1 Teorema: Autovetores associados a autovalores distintos são linear- 
mente independentes. 
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Prova\ (Este teorema será provado para o caso de dois autovalores distintos.) 

Sejam X,, X 2 autovalores, X t ^ X 2 , e Vj, v 2 autovetores associados aos 
autovalores e X 2 respectivamente. Provaremos que Vi e v 2 são LI. 

Seja tfjV! + tf 2 v 2 = 0. Apliquemos a esta equação a transformação T - X 2 /. 
Usando a linearidade de T e lembrando que 7\v,*) = X z v/ e /v/ = v,- para i = 

= 1,2. resulta 

ai(Ai - X 2 )vi + tf 2 (X 2 - X 2 )v 2 = 0 
ou 

tfi(Xi - X 2 )v! = 0 

Como vj i^O e Xi ^X 2 , determinamos que a x = 0. 

Voltando à equação original e aplicando T - Xi/, temos 

üi(Xt - Xi)v, + a 2 (k 2 - Xi)v 2 = 0 

ou 

tf 2 (X 2 ' X|)v 2 = 0 

Isto é, a 2 = 0. Portanto vi e v 2 são LI. 

A demonstração deste teorema para o caso geral em que temos Xj, X 2 , ♦> 
\ r autovalores distintos é feita de maneira análoga. Partimos da igualdade 

tf! v i + tf 2 v 2 + ... + a r \ r = 0 

e aplicamos os operadores T - X// para mostrar que a x = a 2 = ... = a r = 0. 

Por exemplo, para mostrarmos que tf 2 =0, aplicamos sucessivamente à equaçao 
original os operadores: 

T - T - x 2 4 t - X 3 /. T - x 4 /,.... r - V 

Uma conseqüência deste teorema que nos interessará particularmente é 
dada a seguir. 


7.1.2 Corolário: Se K é um espaço vetorial de dimensão n e T :V ■+ V é 
um operador linear que possui n autovalores distintos, então V possui üma 
base cujos vetores são todos autovetores dc T. 

Em outras palavras, se conseguirmos encontrar tantos autovalores distintos 
quanto for a dimensão do espaço, podemos garantir a existência de uma base 
de autovetores. 


7.1.3 Exemplos 

Exemplo 1 : Seja T :R 2 ^ R 2 a transformação linear definida por 
7U, v) = (- 3x + Ay, -x + 2 y) cuja matriz em relação à base canônica a é 
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-3 4 

'1 2 

(Veja o Exemplo 1 de 6.2.2.) 

Queremos encontrar uma base p de autovetores, se possível, e ainda 

observar de que tipo é a matriz [T]^. Desde que X, = l e X 2 = -2, e portanto 

Xi ^ Á 2 » podemos garantir, pelo corolário anterior, a existência de unia base 
de autovetores. 

De fato, dois autovetores associados a Xj e X 2 são Vj = (1, 1) e v 2 = 

= (4, 1) respectivamente, os quais formam uma base de R 2 . Isto é, o espaço 
admite uma base P = í v i> v 2 } formada por autovetores de T. 

Calculemos agora [T]jj. Como 7Tv,) = lv, = lv, + 0v 2 e 7T(v 2 ) = -2v 2 = 
= 0v, - 2v 2 , 


mj- 



0 

-2 


Observe que a matriz de T em relaçao à base de autovetores é uma ma¬ 
triz diagonal. 

Exemplo 2: Seja T : R 3 -► R 3 uma transformação linear cuja matriz em 
relação à base canônica a é 


[Tf 

a 


3 0-4 

0 3 5 

0 0-1 


fÇK) = detar]® - X/) = (3 - X) 2 (-1 - X). 

Os autovalores são Xj = 3 e X 2 = -1. Associado a X! = 3 temos auto¬ 
vetores do tipo (x, y, 0). 

Portanto obtemos dois autovetores LI. 


V! =(U o, 0) 

V2= (0,1,0) 

Associado a X 2 = -1 temos um autovetor LI, u = (4, -5, 4). 

Então p = {v l7 v 2 , u} é uma base de R 3 constituída de autovetores de Te 



0 

3 

0 


0 

0 

-1 


202 ÁLGEBRA LINEAR 


Observe que em relação a esta base de autovetores, a matriz de T e uma 
matriz diagonal. 

É claro que as matrizes diagonais [T]$ que foram obtidas nos Exemplos 

1 e 2 não o foram por acaso. Dada uma transformação linear qualquer 
j V, se conseguirmos uma base 0 = {v!, ..., v„} formada por autovetores 

de T, então, como 

r(v,) = X,V 1 + Ovj + ... + 0v„ 
r(v 2 ) = 0v, + X 2 v 2 + ... + 0 v n 


r(v„) = Ovi + 0v 2 + ... + K v n> 

a matriz \T]^ será uma matriz diagonal onde os elementos da diagonal princi 
pal são os autovalores Xj, isto é, 


ms- 


X, o 
0 X 2 

o o 


Não precisamos ter necessariamente os X,- distintos (veja o Exemplo 2). 
Na verdade, um autovalor aparecerá na diagonal tantas vezes quantas iorem os 
autovetores LI a ele associados. 

Por outro lado, se 7 = {u,, .... u„} 6 uma base de X tal que 


[rfij = 


». o 

0 a 2 

0 0 


note que u,, ..., u n são necessariamente autovetores de T com autovalores 
d\ , <*n respectivamente. De fato, da definição de [T]^ temos. 


T( u,) = a Y Ui + 0u 2 + ... + 0u n = a x u, 


r(u rt ) = Oui + 0u 2 + ... + <2n u n “ a n u n 
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Concluímos então que um operador T : V -► V admite uma base em re¬ 
lação à qual sua matriz [Té diagonal se, e somente se essa base /? for forma¬ 
da por autovetores de T 1 É este o motivo da definição que se segue. 

7.1.4 Definição: Seja T: V -► V um operador linear. Dizemos que T é um 
operador diagonalizável se existe uma base de V cujos elementos são autoveto¬ 
res de T. 

Os operadores dos Exemplos 1 e 2 são, portanto, diagonalizáveis. Vamos 
dar a seguir um exemplo de um operador não diagonalizável. 

Exemplo: Seja T : R 3 R 3 a transformação linear cuja matriz em relação 
à base canônica a é 

~3 -3 -4~ 

m"= 0 3 5 

[o 0 -i_ 

Como P(K) = (3 - X) 2 (-1 - X), os autovalores são X] = 3 e X 2 = -1, 
Associado a X, = 3 conseguímos apenas um autovetor LI, por exemplo, v = 

= (1, 0, 0). Associado a X 2 = -1 temos o autovetor LI, u = (-1, -20, 16). 

Neste caso, temos apenas dois autovetores LI para T, e portanto não existe 
uma base de R 3 constituída só de autovetores. Isto significa que em nenhuma 
base a matriz de T é uma matriz diagonal, ou seja, T não é diagonülizável. 

7.1.5 Aplicação ao Estudo de Vibrações 

Consideremos dois corpos de dimensões desprezíveis e massas m t e m 2 , res¬ 
pectivamente, presos a 3 molas de constantes elásticas k u k 2 e k 3 conforme 
mostra a Figura 7.1.1. Supondo que o movimento só ocorra na horizontal, 
como podemos estudar a posição dos dois corpos em função do tempo a 
partir de uma posição diferente da de equilíbrio? 

posição 
de equilíbrio 

posição em 

um instante í 
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Chamando de * e y os deslocamentos (horizontais) em relação à posição 
de equilíbrio de m! e e lembrando que o produto da massa pela acelera¬ 
ção é igual à força aplicada e que a força que uma mola exerce (em primeira 
aproximação) é igual menos o produto da sua constante de elasticidade pelo 
deslocamento em relação à posição de equilíbrio, podemos escrever (onde 
3c e y indicam a derivada segunda em relação ao tempo): 

m x x ~ -k x x + k 2 (y - x) 
m 2 y = -k 2 (y - x) *k 3 y 

ou, em termos de matriz: 



Devemos achar então como x e y variam em função do tempo, ou seja, 
resolver o sistema de equações diferenciais anterior. Observe que uma das difi¬ 
culdades de resolver o sistema é o fato dele ser acoplado, isto é, em ambas as 
equações aparecem ambas as variáveis. Uma possível tentativa de resolver o 
problema é a de tentar desacoplar as equações, isto é, obter duas novas equa¬ 
ções, equivalentes às anteriores, de tal forma que em cada uma delas apareça 
apenas uma incógnita. Resolvemos, então, cada uma destas equações e volta¬ 
mos para as incógnitas originais. (No Capítulo 12 você poderá ver outros mé¬ 
todos para tentar resolver tais sistemas.) 

Observe que em uma situaçao deste tipo teríamos um sistema da forma. 

X = \ t X 
Y = X 2 Y 

ou, na forma matricial 



Isto nos dá a pista para tentar desacoplar o sistema original: devemos 
diagonalizar (se possível) a matriz do sistema original. 

Façamos isto no caso particular em que m x = m 2 = m e k x = k 2 - Á 3 - k . 
As equações tornam-se então (na forma matricial) 
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Podemos pensar na matriz 


-2 k 

k 

m 

m 

k 

-2k 

m 

m 


como a matriz de um operador linear de R 2 em R 2 em relação à base canó¬ 
nica e x e y como as componentes de um vetor em relação à base canônica. 
Tentemos diagonalizar taJ operador: 


f\X) = det 


m 


Portanto os autovalores são X, = ± e X 2 = e os autovalores associados a 

eles sao v, = (1,1) e v 2 = (1,-1), respectivamente. Chamando a a base canô¬ 
nica, p = {i>i, v 2 } a base composta por tais autovetores e 

\v\ n .m temnv 


y -I <\r 






Além disso, por simples derivação: 


1 -1 


* = [if 
y J cr Y 

Substituindo estes resultados na equação original vem: 

<'£ [y] ■ A • K • [y 
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Podemos resolver separadamente cada uma dessas equações obtendo 


X = A,sen(y— t + 0 x ) 


Y = A 2 sen(y-^-f + 8 2 ) 

que são os chamados modos normais de vibração do sistema. 
Voltando para as variáveis originais temos 

x = A.sen^y^í + 0^)+ k 2 sznÇf^t + 0, 



7.2 POLIN0MIO MINIMAL 

Nos exemplos anteriores nós mostramos que os operadores eram ou nao diago- 
nalizáveis, exibindo uma base de autovetores, ou mostrando a inexistência desta 
base. Em casos de espaços vetoriais de baixa dimensão, como os dos exemplos, 
é este o procedimento conveniente. Entretanto, podemos estar interessados - 
principalmente no caso de espaços vetoriais de dimensão alta, onde os cálculos 
são longos — em saber se um operador linear é diagonalizável ou não, sem 
calcular os autovetores. Já sabemos a Tesposta para este problema na seguinte 
situação: se dim V = n e o operador linear T tem n autovalores distintos, 
então ele é diagonalizável (veja 7.1.2). No caso geral, a resposta está ligada ao 
aspecto de um polinómio que chamaremos de polinómio minimal do operador 
T. Para isto, vamos introduzir a noção de polinómios calculados em matrizes. 
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7.2.1 Definição: Seja p(x) - a n x n + ... + a x x + a 0 um polinómio e A 
uma matriz quadrada. Então p{ A) é a matriz 

P(k) = a n A" + ... + úfjA + u 0 I. 

Quando p(k) = 0, dizemos que o polinómio anula a matriz A. 

Exemplo. Sejam p(x) = * 2 - 9 e q( x ) = 2x + 3. 



Então, p(x) anula A e q{x) não anula A. 

7.2.2 Definição: Seja A uma matriz quadrada. O polinómio minimal de A 
é um polinómio 

m(x) = x k + a k _ |X*~ l + ... + a 0 

tal que 

0 w(A) = 0, isto é, m(x) anula a matriz A. 

«) m( x ) é o polinómio de menor grau entre aqueles que anulam A. 

Observe que o coeficiente do termo x k do polinómio minimal é 1 
(** = 0 

A seguir apresentaremos alguns resultados envolvendo polinómio minimal 
que vão nos levar a descobrir um procedimento que nos possibilite determinar 
se um operador linear é diagonalizável ou não, sem calcular os autovetores. As 
demonstrações desses resultados são em geral muito elaboradas, abrangendo 
outros conceitos como o de decomposição de um espaço vetorial em soma df 
reta de subespaços, e que fogem aos objetivos deste texto 1 . 

7.2.3 Teorema: Sejam T V >V um operador linear e a uma base qual¬ 
quer de V de dimensão n. Então T é diagonalizável se, e somente se o polinó¬ 
mio minimal de [71 a é da forma 
ot 

1 Vocè pode encontrá-las. por exemplo, em HotTman, K. e Kunze, R. Álgebra Linear . Editora 
Polígono. São Paulo, 1971. 
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m(x) = (x - Ai) (x - X 2 ) ... {x - À r ) 
com Xi, X 2 , ...» X r distintos. 

O nosso problema que consiste em determinar se í é diagonalizável 
reduz-se então ao de saber achar o polinómio minimal de T. Os teoremas que 
nos ajudarão a fazer isto são: 

7.2.4 Teorema de Cayley-Hamilton: Seja T : V V um operador linear, a 
uma base de F e p(x) o polinómio característico de T. Então 

p([Tf a ) = 0 

Isto significa que o polinómio característico é um candidato ao polinómio 
minimal porque ele satisfaz a condição /) da detinição 7.2.2. 


Exemplo : (Demonstração do teorema no caso 2 x 2.) 
Sej, [r g. 

Então o polinómio característico é 


a b 
c d 


p(X) = det 


Então p([T]*) = a 


- bc 



= (a - X) (d - X) - bc. 


a b 
c d 


7.2.5 Teorema: As raízes do polinómio minimal são as mesmas raízes 
(distintas) do polinómio característico. 


Estes dois teoremas juntos nos dizem como achar o polinómio minimal 
de um operador linear T' VV. O polinómio minimal deve ser de grau menor 
ou no máximo igual ao do polinómio característico (7.2.4) e ainda deve ter as 
mesmas raízes (7.2.5). 

Por exemplo, seja T\V-+V um operador linear e a uma base de V. Su¬ 
ponhamos que o polinómio característico de T seja p(X)' : (X-3) (X-l) 3 (X + 5). 
Então o seu polinómio minimal será um dos polinómios: 



Pl (x) = (x - 3) (x - 1) (x + 5) 
p 2 (x) = (X - 3) 2 (x - 1) (x + 5) 
p 3 (x) = (x - 3) (x - l) 2 (x + 5) 

Pa(x) = (x - 3) (x - l) 3 (x + 5) 

Ps(x) = (x - 3) 2 (x - l) 2 (x + 5) 

PÁ X ) = (x - 3) 2 (x - l) 3 (x + 5). 

Como o polinómio minimal é o de menor grau que anula [F]^, verifica¬ 
mos primeiramente se /^([F]^) = 0. Em caso afirmativo, /?i(jt) será o polinó¬ 
mio minimal. Se ^([F]^) ^ 0, testamos p 2 ([F]®) e assim sucessivamente. Na 

pior das hipóteses o polinómio minimal será p(X) isto é, o polinómio caracte¬ 
rístico. 

Volte agora ao teorema 7.2.3. O operador acima só será diagonalizável se 
o seu polinómio minimal for Pi(x). Esse argumento nos motiva a reinterpretar 
o teorema 7,2.3. 

7.2.6 Teorema: Sejam Xj, X 2 » ...» X r os autovalores distintos de um ope¬ 
rador linear T. Então T será diagonalizável se, e somente se o polinómio 

(x - Xi) (x - X 2 ) ... (x - \ r ) 

anular a matriz de T. 


Exemplo: 0 operador linear F: R 4 R 4 definido por T(x , y, z, t) - 
= (3x - 4z, 3y + 5z, -z, -r) é diagonalizável? 

Resolução : Seja a = {(1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1)} 
a base canónica. Então a matriz 

0 -4 O” 

3 5 0 
0-10 
0 0-1 

Calculemos o polinómio característico 

p(X) = detím" - V) = (3 - X) 1 (-1 - X)\ 

Os autovalores são X] = 3 e X 2 = -1, ambos com multiplicidade 2. Então, os 
condidatos para o polinómio minimal são 


[T] a = 
L J a 


Pí {x) = (x - 3) (x + 1) 
Pi(x) = (X - 3) 2 (x + 1) 
p 3 (x) = (x - 3) (x + ]) 2 
PÁx) = (x - 3) 2 (x + l) 2 


Biblioteca de 
Ciência 4 Tecno 

UFPe 




210 ÁLGEBRA LINEAR 


Notamos que = 0 e é, dentre os candidatos, o de menor grau. 

Então 

Pi( x ) = (x - 3) (x + 1) 

é o polinómio minimal. Portanto, T é diagonalizável, isto é, existe uma base $ 
de autovetores e nesta base 

~3 0 0 0” 

0300 

UI /5 0 0 -1 0 

0 0 0 -1 

* 7.3 DIAGONALIZAÇÃO SIMULTÂNEA DE DOIS OPERADORES 

Suponhamos que sejam dados íj : V -*• V e T 2 : V -* V operadores lineares, am¬ 
bos diagonalizáveis. Isto significa que existem bases cti e a 2 de V tais que 

[TjÇ e \T 2 são diagonais. No entanto, não podemos garantir que oq - a 2 , 

isto é, não podemos garantir sempre que existe uma mesma base a de V em 
relação à qual as matrizes de r, e T 2 admitem o mesmo conjunto de autove¬ 
tores LI. Em que situação vale tal relação entre 7^ e F 2 ? Mostra-se 2 que dados 
T x e T 2 operadores diagonalizáveis, então T x e T 2 são simultaneamente diago- 
nalizáveis se e somente se íj e T 2 comutam {T X °T 2 = T 2 oT i). 

Na prática, dados T, eí 2 , tomamos uma base 0 qualquer de V e verifi¬ 
camos se T y e T 2 são diagonalizáveis. Se isto acontecer e, além disto, [T x ]^[T 2 = 

= [T 2 ]jj [T x fp, então podemos concluir que T x e T 2 são simultaneamente dia¬ 
gonalizáveis. 

Exemplo : Sejam T x , T 2 :R 3 -> R 3 operadores lineares cujas matrizes em 
relação à base canônica são respectivamente 



Calculando os autovalores de T x , temos \ x = 1, X 2 = 2 e \ 3 - 2. Observamos 
que o polinómio m(;t) = (x - 1) (x - 2) anula [T], e portanto T x é diagonali- 

2 Veja, por exemplo, Hoffman, K. c Kunze, R. op. dt. pág. 190. 
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zável (veja 7.2.6). Calculando os autovalores de T 2 , temos X t = -1, X 2 = 3 e 
X 3 = 4. Como eles são distintos, T 2 é diagonalizável (veja 7.1.2). Além disso, 


[T] ] [r 2 ] 



It 2 ] [r,] 


Portanto, 7j e T 2 são simultaneamente diagonalizáveis. 

Poderiamos ter observado isto calculando os autovetores. 

Para T ,: com X] = 1 obtemos os autovetores (x, -2x, 0) e com X 2 = 2, os 
autovetores (-2>\ y, z). 

Para T 2 : X| = -1 é associado ao autovetor (x, -2x, 0), X 2 = 3 a (-2 y, y, 0) e 
X, = 4 a (0, 0, z). 


Então (1, -2, 0), (-2, 1, 0), (0, 0, 1) sao simultaneamente autovetores LI de 
7, c T 2 , e desse modo na base 0 formada por estes vetores 



1 0 o] f-1 0 0 

0 2 0 e [T 2 t= 0 3 0 

0 0 2j 0 0 4 


7.4 FORMA DE JORDAN 

Já sabemos que nem todo operador é diagonalizável. Por exemplo, T: V^ V, 
onde V é um espaço vetorial real de dimensão dois, cuja matriz em relação a 
uma base a é 



a qual não é diagonalizável, pois o seu polinómio característico é X 2 +1, que 
não possui raízes reais. Assim, este operador não possui autovetores, e portanto 
não possui autovalores. Entretanto, se o espaço vetorial V for complexo (isto 
é, se permitirmos que os escalares sejam números complexos quaisquer) e consi¬ 
derarmos a mesma matriz, o polinómio característico passará a ter duas raízes 
distintas, / e e portanto o operador será diagonalizável. De fato, um autove¬ 
tor associado ao autovalor / é (1, /) e um associado a -z é (1, -z). Se 0 for a 


base destes autovetores 


, então [T]q 


Vemos assim que com relaçao 
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ao fato de um operador linear ser diagonalizável ou não, o conjunto dos esca¬ 
lares no qual trabalhamos desempenha um papel importante. 

Ainda assim, mesmo permitindo valores complexos, nem todo operador 
linear é diagonalizável. Por exemplo, seja T: V V, onde V é um espaço veto¬ 
rial complexo de dimensão 4 e 


[71 


a 

a 


0 1 0 

-1 0 0 

0 0 1 

0 0 0 


n 

0 

0 

1 

1 


onde a é uma base de V. Então, o polinómio característico de T é p(\) == 

- (X - /) (X + /) (X - l) 2 , e portanto seus autovalores são Xi = ?\ X 2 = -É 
X 3 ^ 1 (com multiplicidade 2). Não é possível, entretanto, encontrar dois auto- 
vetores LI (tente!) para X 3 = 1, e assim T não é diagonalizável. 

Porém, quando T : V V for um operador linear não diagonalizável e \ 
um espaço vetorial complexo, poderemos achar sempre uma base de V % tal 

que [7ljj assuma uma forma especial, chamada forma de Jordan . Esta forma é 

obtida por blocos do tipo 

r 

x, 0 

1 Xy 

1 . 

X/ 

o i xi 

ou [Xy] colocados na diagonal. 


Exemplo : 


-2 

0 

! o 

0 

0 

0 

0 

0 

0 

1 

-2 

! o 

0 

0 

0 

0 

0 

0 

0 

0 

i-2 

ol 

0 

0 

0 

0 

0 

0 

0 

Ll- 

- 2 L 

0 

0 

0 

0 

0 

0 

0 

0 

o L- 

-2 

i-° 

0 

"1 0 

H- 

0 

0 

0 

0 

0 

0 

0 

[_ 5 

0 

0 

0 

0 

0 

0 

0 

0 

1 3 

0 

“0" 

0 

0 

0 

0 

0 

0 

! i 

3 

0 

0 

0 

0 

0 

0 

0 

1 0 

1 

1 

3 
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A demonstração deste fato é um tópico especial que deve fazer parte de 
um estudo mais avançado de Álgebra Linear 3 . 


7.5 EXERCÍCIOS 

1. Entre os operadores dos exercícios 2 a 8 da secção 6.3 verifique quais são 
diagonalizáveis. 

2. Dizemos que uma matriz A fj Xfj é diagonalizável se seu operador associado 
r A : R' 1 R n for diagonalizável, ou seja, A é diagonalizável se, e somente 
se A admitir n autovetores Ll. Baseado nisto, verifique quais das matrizes 
dos Exercícios 9 a 1 8 da secção 6.3 são diagonalizáveis. 


3. Dada a matriz 

2 10 0 
0 2 0 0 

A ' 0 0 2 0 

0 0 0 3 


a) Ac diagonalizável (use a definição do exercício anterior). 

b) Encontre seu polinómio minimal. 


4. Seja A uma matriz 3x3 triangular superior, com todos os seus elementos 
acima da diagonal distintos e não nulos. 


A = 


a 

0 

0 


b c 
d e 
0 / 


a) Quais são os autovalores e autovetores de A? 

b) Qual é o polinómio minimal de A? 


5. Para quais valores de a as matrizes abaixo são diagonalizáveis? 



1 

a 


b) 


B = 


a 

1 


3 Pum detalhes consulte Lipschutz, S. Álgebra Linear . Mc Graw-Hill do Brasil Ltda., Rio de 
Janeiro, 1971: ou Hoífman. K. e Kunze, R- Álgebra Linear , Editora Polígono, São Paulo. 
1971: ou Gdtónd, E M.: Lectures in Linear Álgebra; Intcrscience Pubtishers, New YorE, 
1961. 
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6. Sejam T: R 3 -+ R 3 linear, a = {(1,0, 0), (0, 1, 0), (0, 0, 1)}, a base ca¬ 
nônica de R 3 , 0 = {(0, 1, 1), (0, -1, 1), (1, 0, 1)} e 

~2 o r 

m“ =o-3 i 

[0 0 -3 

a) Encontre o polinómio característico de 7\ os autovalores de T e os auto- 
vetores correspondentes. 

b) Ache [fljj e o polinómio característico. Que observação você faz a este 
respeito? 

c) Encontre uma base y de R 3 , se for possível, tal que [T]^ seja diagonal. 

7. a) Sejam T:V^V um operador linear (V de dimensão finita) e a e 0 bases 

distintas de T. Mostre que 

det [r]“ = det [fljj 

(Sugestão: veja a relação entre [7*]* e [7lg no Capitulo 6). 

b) Se A„xm é diagonalizável, mostre que o determinante de A é o produ¬ 
to de seus autovalores. 

(Sugestão: considere T A : R" -> R", observando que a matriz de T A na 
base canônica é exatamente A. Use então o resultado do item (a) consi¬ 
derando como a a base canônica e 0 a base de autovetores. 

j 2 

8. Mostre que a matriz A = 7 é semelhante à matriz 

9. a) Mostre que um operador linear T (num espaço de dimensão finita) que 

comuta com qualquer operador linear diagonalizável é diagonalizável. 
b) Nas condições do item (a) mostre que na verdade T é um múltiplo esca¬ 
lar do operador identidade, isto é, existe um número r tal que T “ r * I 

10. Diz-se que um operador linear T\ V V é nilpotente se existir um número 
inteiro positivo n , tal que T n - 0 (isto é, T 0 T 0 T 0 T 0 T 0 T 0 ... oT(\) = 0) 
para todo v E V). 

a) Seja T nilpotente. Encontre seus autovalores. 

b) Encontre uma matriz A 2 * 2 # 0 tal que T A :R 2 R 2 seja nilpotente. 

c ) Mostre que um operador linear nilpotente, não nulo, não é diagonalizável 
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11. Diz-se que um operador linear T.V^Vé idempotente s e T 2 - T (isto é, 
se ToT(y) = T(v) para todo v € F). 

a) Seja T idempotente. Ache seus autovalores. 

b) Encontre uma matriz A 2 x 2 0 tal que T A : R 2 -> R 2 seja idempotente. 

c) Mostre que um operador linear idempotente é diagonalizável. 


* 12. Mostre que A 


não é diagonalizável. No entanto, se A repre¬ 


sentar, numa certa base, um operador linear T :V -► V, onde V é um espaço 
vetorial complexo , então T é diagonalizável. Verifique este fato ou, equiva¬ 
lentemente, que existe uma matriz com elementos complexos P 3X3 , inversí- 
vel, tal que 


3 0 0 
0 / 0 
0 0 i 


13. Problema-pesquisa: 
Seja 


M a a 

a M a 

a a M 


M a 
a M n xn 


onde M e a ^ 0 são números reais. Mostre que 
a) Os autovalores de A são 

\ ~ M - a com multiplicidade n - 1 
e u = Af + (n - l)a 
h) det A = (M - a) n i * [M + (n - 1 )a] 

(Este é um caso particular da situação estudada no artigo “sobre uma classe 
de matrizes cujo problema de autovalores é facilmente solucionável” de 
Odelar Leite Linhares, publicado na revista Ciência e Cultura (SBPC) volume 
29, número 8, de agosto de 1.977.) 

14. Utilize a forma diagonal para encontrar A" nos seguintes casos (n natural): 

r. n r o 7 -6 _ 

a) À » , * *) A = -1 4 0 

L " 1 l _0 2 -2 _ 

Você pode generalizar o seu procedimento para o caso de uma matriz qua¬ 
drada qualquer? Quais são as condições? 


Biblioteca de 
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*15. Considere o sistema mecânico mostrado na figura abaixo 



Utilizando os procedimentos da secção 7.1.5 estude a vibração do sistema 
quando ele é tirado da posição de equilíbrio. Resolva completamente descre¬ 
vendo o comportamento do sistema no caso em que Wj * 0,5 kg, m 2 = 

= 0,5 kg, ki = 1,2 — , k 2 = 1,8^ . Os deslocamentos iniciais dos corpos 

1 e 2 são, respectivamente, 0,1 m para cima e 0,2 m para baixo. 

7.5.1 Respostas 

1. 6.3.2; 6.3.3; 6.3.4 e 6.3.8 são diagonalizáveis. 

2. 6.3.9: 6.3.10; 6.3.13; 6.3.14; 6.3.16 e 6.3.17 são diagonalizáveis. 

3. a) Não 

b) p(x) = (2 - x) 2 (3 - x) 

5. a) a ^ 1 

b) a = 0 

6. a) p(X) = (2 - X) (3 + X) 2 ; X, = 2, v, = (*, 0, 0); X 2 = -3, v 2 = (0, y. 0) 

-3 0 -y 

.1 .4 -L ,p(X) = (2-X)(3 + X) 2 

1 1 3 _ 

O polinómio característico é independente da base. 

c) Não existe. 



8 . 
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10. a) X = 0 

b ) [0 0 ' 

1 0 

c') Se T fosse diagonalizável, existiria uma base tal que os autovalores esti¬ 
vessem na diagonal de [Tjjj, uma matriz diagonal. Mas os únicos autova¬ 
lores de T são 0 (veja a), e logo, \T]^ = 0. É dizer, T seria nulo, o 
que não está de acordo com a hipótese. 


11. a) \ = 0 ou 1 

b) \ 2 -1 

.2 -1 

c) Como T 2 \ = 7v, (T 2 - 7> = 0, ou seja, T 2 - T = 0 
Seja p(x) = x 2 - x = x(x - 1). Então p (T) - 0 

Como os autovalores de T são 0 e 1, o polinómio característico de T é 
da forma p(X ) - (-\) n (1 - X)" 7 . Então p(x) é o polinómio minimal de 
T e como os fatores lineares são distintos, T é diagonalizável. 


14. a) Note que se temos uma matriz diagonal então 

. Diagonalize, então, a matriz À calculando os autovalores 

a 2 J 

e autovetores respectivos (é possível fazer isto), bem como a matriz de 
mudança de base. Utilizando 5.4.10 pode-se escrever 





Portanto 



_1_ r-l+2« + * 4-2" + 2 

3 _i+2" 4-2” 


b) É similar ao anterior. 
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No caso geral o procedimento poderá ser o mesmo se A for uma matnz 
diagonalizável. Isto é, sendo B a forma diagonal de A, 

A = CBCT 1 e então 

A" = (C . B . C-'y» = (CBC' 1 ) • (CBC -1 )... (CBC" 1 ) = CB"C' 1 

^-V- J 

n vezes 

Assim temos um processo bem mais simples que o usual para se obter a 
potência de uma matriz diagonalizável, uma por ser B uma matriz dia¬ 
gonal B" é calculada diretamente. 


Leituras Sugeridas e Referências 

1 Gelfond, I. M.; Lectures in Linear Álgebra; Interscience Publishers, New 1961 

2 Hoffman, K. e Kunze, R.; Álgebra Linear; Editora Polígono. Sao Paulo, 197 . 

3 Lipschutz, S.; Álgebra Linear; McGraw-Hill do Brasil Ltda., Rio de Janeiro, 1971. 




PRODUTO INTERNO 


8.1 INTRODUÇÃO 

Estaremos interessados neste capítulo em formalizar os conceitos de com¬ 
primento de um vetor e de ângulo entre dois vetores. Com isto teremos pro¬ 
cessos para que se possa “medir” num espaço vetorial, da mesma forma pela 
qual se mede no plano ou no espaço. E é a noção de medida que nos leva a 
precisar conceitos como o de aproximação, área, volume etc. 
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Consideremos inicialmente o plano R 2 , munido de um referencial carte¬ 
siano ortogonal (eixos perpendiculares) e um ponto P de coordenadas (x, y). 
Vamos calcular a distância deste ponto P à origem. Observando a figura e utili¬ 
zando o teorema de Pitágoras, temos que d = \J x 2 + y 2 . Podemos também 
interpretar este resultado dizen do que o comprimento (que passaremos a chamar 
de norma) d o vetor (x, y) é y/x 2 + y 2 . Denotaremos isto por \\(x, y)\\ - 
= \J~x 2 + y 2 . Analogamente, a distância d entre dois pontos (x 1? >q) e 
(x 2> yi) & a Rorma do vetor diferença, isto é, 

d = n/C*! - x 2 ) 2 + O, - y 2 f 



Consideremos agora um corpo no plano R 2 que se desloca em linha reta 
da origem até um ponto (x l9 y x ) por ação de uma força constante F = 

= (* 2 , >> 2 ). Queremos saber qual é o trabalho realizado. Dos conceitos da física 
sabemos que o trabalho é dado pela equação: T = IIFII • llvll ■ cosí? onde 8 é 
o ângulo entre v = (jc i 1 ) e F = (x 2 , y 2 ). ^ as cos 0 = cos (62 - 0i) = 

= COS0 2 COS01 + sen 0 2 sen 0 t =-“■ -j^r + • j\. Portanto, T = 

IIFII llvll IIFII llvll 

= * 1*2 + yiy 2 ‘ Ou seja, o trabalho produzido é um “produto” dos vetores ve 
F, denotado por (v, F>, e dado pela regra: (v, F> = ((x l9 y x ), (* 2 , y 2 )) = 

= x x x 2 + ^ 1 ^ 2 • Este produto recebe o nome de produto escalar ou produto 
interno, e tem uma relação importante com a norma de um vetor v = (x, y): 

II v|| = \J x 2 + y 2 = \fx • x + y • y = yj (v, v7. 

Se, ao invés de trabalharmos no plano R 2 , estivéssemos trabalhando no 
espaço R 3 (munidos de um referencial cartesiano ortogonal), teríamos encon¬ 
trado uma expressão similar para o produto escalar: 



(( x i > yi 1 z i )> (*2 > yi » z 2 )) - x x x 2 + y x y 2 + z x z 2 
e a mesma relação com a norma de um vetor v = (* y z) 
llvll = 

Voltando ao caso do plano, se tivéssemos trabalhado com um referencial 
na° ortogonal (eixos não perpendiculares), e quiséssemos calcular a distância da 
origem até um ponto P (cujas coordenadas em relação ao referencial fossem 
(x>y))> teríamos, usando o teorema de Pitágoras, 

d = cosa) 2 = + (2 cos a)xy +/ 



Figura 8.1.3 

Observe que, se usássemos 0 produto escalar 

<(^i.7i). (x 2 ,y 2 )) ^ Xl x 2 + y x y 2 

neste caso não valeria a relação llv II = \/7vv7 , mas ela passaria a valer se 
usássemos a seguinte regra para o produto: 

(x 2 , y 2 )} = X t x 2 + (cosa)*,.y 2 +(cosa>r 2 ^ 1 + yi y 2 po i s 
<v, v) = <(*, y), {x, >»)> = x 2 + (cosa)*)' + (cos a )yx + y 2 - ||v|| J . 

Portanto, novamente a noção de distância poderia ser dada a partir de um pro- 
duto interno de vetores. 

Concluímos destes exemplos, que 0 processo usado para se determinar 
medidas num espaço pode variar e, em cada caso, precisamos ser bem claros so¬ 
bre que produto interno (e consequentemente sobre que norma) estamos tra¬ 
balhando. Estes produtos, no entanto, gozam de propriedades que são utilizadas 
para definir produto interno num espaço vetorial real qualquer. 

8.1.1 Definição: Seja V um espaço vetorial real. Um produto interno so¬ 
bre V é uma função que a cada par de vetores, Vj e v 2 , associa um número 
real, denotado <Vi, v 2 >, satisfazendo as propriedades: 
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i) <v, v> > 0 para todo vetor v, e 

<v, v> = 0 se, e somente se v = 0 

ii) (avi, v 2 > = a<v n v 2 > para todo real a. 

Ui) <Vj + V 2 , V 3 > = <Vj , v 3 > + <v 2 , v 3 >. 

iv) <Vi, v 2 > = <v 2 , Vi>. 

8.1.2 Exemplos 

Exemplo 1: O produto escalar usual de vetores do espaço R 3 . 

Para v = (jcj , * 2 , x 3 ) e w = (y x , y 2 , y 3 ) 

<v, w> *= xj-q + x 2 y 2 + x 3 y 3 . 

De modo análogo, define-se o que chamamos produto interno usual para o es¬ 
paço R n : 

Dados v = (*!, x 2 , x n ) e w = (y lr y 2 , *» yn)> 

<V, W> = + ^2^2 + — + x nyn 

Veremos em 9.1.1 que, uma vez escolhido um tipo especial de base, todo pro¬ 
duto interno tem uma expressão como esta. 

Exemplo 2\ V = R 2 , Vi = (*i, Jfi) e v 2 = (* 2 » ^ 2 ) 

<vi, v 2 > = 2x x x 2 - x x y 2 - x 2 y 1 + y\y 2 

Exemplo 3. Se Fé o espaço de funções contínuas no intervalo 
[0, 1], dadas f l e f 2 E F, definimos 

<fi, f 2 > =f \ f 1 (t)f 2 (0* 

Poderemos verificar que as quatro condições da definição são satisfeitas 
em cada exemplo e, portanto, ( ,) é um produto interno. 
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Exemplo 4: Um campo elétrico uniforme induz uma força constante dada 
pelo vetor f = (10, 2, -5) em uma partícula carregada eletricamente. Vamos 
calcular o trabalho realizado quando a partícula se move na trajetória que co¬ 
meça e termina em A, dada pela Figura 8.1.4. O trabalho total é 

T = Tab + ?bc + Tç A 

onde r A b é 0 trabalho realizado de A a B etc. Ainda, AB = (2, 3. 2) - 
~ (1, 1, 3) = (1, 2, -1), BC = (0, -1, -1) e CA = (-1, -1, 2). Como foi mos¬ 
trado na introdução, o trabalho é o produto interno da força pelo vetor que 
dá o deslocamento. Então T AB = (f, AB> = <(10, 2, -5), (1, 2, -1)> = 19, 

7ca ~ -22. Portanto, T = 0. 


Exemplo 5: Uma fábrica produz um determinado componente eletrônico. 
Devido a variações na linha de produção, qualidade de material etc., verifica-se 
que os componentes não têm todos a mesma durabilidade. Fazendo-se experiên¬ 
cias com relação ao número de horas de uso efetivo, obtém-se a seguinte tabela 
que relaciona durabilidade com a respectiva probabilidade. 


durabilidade/h 

■ 

2000 

2500 

... 

2700 

3000 

probabilidade 
_ l 

1/3 

1/5 

1/5 

4/15 

1 _ 


Queremos saber a durabilidade média dos componentes. 

Temos, então, a durabilidade média (ou valor médio ou valor esperado) 

que é 

. 2000(1/3) + 2500(1/5) + 2700(1/5) + 3000(4/15) = 2520 horas. 

O que queremos observar, no entanto, é que a expressão da durabilidade média 
é exatamente a do produto interno canônico em R 4 do vetor probabilidade 

(y , y , j , ” ) pelo vetor durabilidade (2000, 2500, 2700, 3000), isto é, 

<( I ’ ? ’T * 75 )• ( 2000 ’ 2500 ’ 2700 ’ 3000)> 

De modo geral, se uma grandeza pode assumir valores x^, x 2 , ..., x n com 
probabilidades p lt p 2> p n , respectivamente, então o valor médio da grandeza 
(também chamado valor esperado) é dado pelo produto interno canônico em 

R" 

(( Pi> P2 f PnX (*i> X 2 > x n P — P\ x i + ... + Pn x n Bibfioteca de O. 

Ciência & Tecnotofet 

UFPel 
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Na seção 8.7 você poderá ver uma outra versão deste fato, juntamente com ou¬ 
tras aplicações estatísticas do produto interno. 

O produto interno é usado para caracterizar a noção de perpendicularis- 
mo ou ortogonalidade de vetores. Formalmente: 

8.1.3 Definição: Seja V um espaço vetorial com produto interno < , >. 
Diz-se que dois vetores v e w de V são ortogonais (em relação a este produto 
interno) se <v, w) = 0. No caso em que v e w são ortogonais, escrevemos 
V i w. 

Propriedades: 

i) 0 1 v para todo v G V. 

ii) v 1 w implica que w 1 v. 

Ui) Se v 1 w para todo w E v, então v = 0. 
iv) Se Vi 1 w e \ 2 1 w, então + v 2 1 w. 

v) Se v 1 w e X é um escalar, Xv 1 w. 

Vamos demonstrar a primeira delas e voce poderá provar facilmente as 
outras, usando as propriedades do produto interno. 
í) Para mostrar que 0 é ortogonal a todo vetor v, lembremos que 0 = 

= 0 * v e, portanto, (0, v> = <0 • v, v> = 0 <v, v> = 0. 

A noção de ortogonalidade tem uma aplicação interessante na verificação 
da “honestidade” de apostas. Vejamos isto em um exemplo. 

Exemplo : Duas pessoas A e B fazem a seguinte aposta: elas vão jogar 
duas moedas simultaneamente e, se o resultado for duas caras, A ganha dez 
cruzeiros, se for duas coroas, A ganha sete cruzeiros, e se for uma cara e uma 
coroa, B ganha 9 cruzeiros. Queremos saber se esta aposta é justa, isto é, se A 

não tem mais probabilidade de ganhar do que B, ou vice-versa. 

Para isto, vamos calcular o valor esperado por A e B. Observamos então 
que a probabilidade de dar duas caras é 1/4, de dar duas coroas é 1/4 e de dar 
uma cara e uma coroa é 1/2. O vetor probabilidade é então (1/4, 1/4, 1/2) e o 
vetor aposta do ponto de vista de A é (10, 7, -9) e do ponto de vista de B é 
(-10, -7, 9), onde o sinal menos indica a perda da aposta. O valor esperado 
por A c dado pelo produto interno 

<(1/4, 1/4, 1/2) , (10, 7, -9» = ^ (10) +^(7) -j(9) = 

enquanto que o valor esperado por B é 

<(1/4, 1/4. 1/2), (-10, -7, 9» = | . 
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O valor esperado por B é positivo, indicando que ele tem vantagem na aposta, 
enquanto que o valor esperado por A é negativo, indicando que ele tem maior 
probabilidade de perder a aposta. Esta só seria justa se não houvesse vantagem 
para nenhum dos apostadores, isto é, se o valor esperado para ambos fosse nulo 
ou seja, o vetor probabilidade fosse ortogonal ao vetor aposta. 

O resultado a seguir estabelece uma relação entre ortogonalidade e inde¬ 
pendência linear. 

8 . 1.4 Teorema: Seja (vj, v 2 , ..., v, 2 } um conjunto de vetores não nulos, 
dois a dois ortogonais, isto é, 

<Vj\ \j) = 0 para i /. Então {\ í , ..., v„} é linearmente independente. 
Prova : Seja a x y x + a 2 \ 2 + ... + a n \ n = 0. 

Fazendo o produto interno dos dois membros da igualdade acima por v 2 , temos: 
(a 1 \ l + ... + a n \ n , v/> = <0, v/> 

e, portanto, a x (y x . v/> + ... + <z/(v 2 , v/> + ... + a n <v„, v;> = 0. 

Como <v ; -, v 2 > = 0 para j ^ i c <v 2 , v/> ^ 0, temos a\ <v 2 , v 2 > = 0 
e assim a\ - 0. 

Como isto vale para todo i = 1, n, temos a x = 0, a n - 0; logo 
{vi, v„} é LI. 

Você já deve ter notado que quando se trabalha no espaço ( R 3 ), em ge¬ 
ral é mais simples usarmos a base canônica {i , /, k}. Isso se deve em grande 
parte à característica de que estes vetores são dois a dois ortogonais. A conve¬ 
niência de bases desse tipo se mantém para espaços vetoriais quaisquer, como 
você verá em 8.2. 

8 . 1.5 Definição: Diz-se que uma base iv,, v„} de V é base ortogonal 

se <v,-, \/) = 0 para / j, isto é, os vetores da base são dois a dois ortogonais. 

Observe que, pelo teorema anterior, se obtivermos um conjunto de n ve¬ 
tores dois a dois ortogonais num espaço de dimensão n, este conjunto será uma 
base ortogonal. 


8.2 COEFICIENTES DE FOURIER 

Bases ortogonais são importantes porque existe um procedimento padrão para 
se encontrar as coordenadas de um vetor qualquer em relação a elas. Seja V 
um espaço vetorial com produto interno < , ), 0 = {v 1( v„} uma base orto- 

gonal de V e w um vetor qualquer de V. Vamos calcular as coordenadas de w 
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em relação a 0. Sabemos que w = x { \ { + x 2 v 2 + ... + x„v„ e queremos deter¬ 
minar a i-ésima coordenada j*/. Para isto, façamos o produto interno dos dois 
membros da igualdade acima por v,\ Então <w, v/> = x/ty, v,> 


donde x/ 


. Esta coordenada é chamada coeficiente de Fourier de w 

\ v í'i V|> 


em relação a v/. 


8.2.1 Exemplos 

Exemplo 1: Seja V = R 2 com produto interno usual e 

0 = {(1, 1), (-1, 1)}. 

Observamos que j3 é uma base ortogonal, pois <(1, 1), (-1, 1)) = 1(-1) + 

+ 1(1) = 0. Calculemos [(2, 3)]^. 

Existem x Y e x 2 tais que 

(2, 3)=x,(l, l)+x 2 (-U 1), 

onde x x e x 2 são as coordenadas do vetor (2, 3) em relação à base 0 que esta¬ 
mos procurando. 


<(2, 3 ), ( 1 , 1 )> = <X!( 1 , 1 ) + x 2 (-l, 1 ), ( 1 , 1 )> 

= (Xy(\, i),(l, 1 )> + <X 2 (- 1 , 1 ), ( 1 , 1 » 

= 1), (1, 1)> +* 2 <(-l, 1), CU 1)> 

O segundo termo, jc 2 ((-1, 1), (1, 1)>, é nulo e assim, 

<( 2 , 3 ), ( 1 , 1 » 5 

1 “(( 1 , 1 ), ( 1 , 1 )> ” 2 


Analogamente, 


((2, 3), (-1, 1)) ± 

2 <(-l, 1), (-1, O)” 2 


[ 5/2 

Portanto, [(2, 3)L» = 

[i/2 


Vamos formalizar agora a noção de comprimento de um vetor num es¬ 
paço vetorial. Faremos isto de tal forma que seja verdadeira a relação vista em 
8.1, entre produto escalar e norma. 


8.3 NORMA 

8.3.1 Definição: Seja V um espaço com produto interno < , >. 

Definimos a norma (ou comprimento) de um vetor v em relação a este produ- 
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to interno por IIvil = v<v, v> . Se livll = 1, isto é, <v, v> = 1, v é chamado ve¬ 
tor unitário. Dizemos também, neste caso, que v está normalizado. 

Observe que todo vetor não nulo \ E V pode ser normalizado, tornando 


. Se considerarmos, por exemplo, V = R 3 e ( , > o produto interno 


usual, então se v = ( Xl , x 2 , x 3 ) E R 3 , ||v|| & \J <v, v> = \f x\ + x\ + x 3 que 
é o comprimento do vetor v. Assim, para v ~ (1, 2, -1), teremos o vetor nor 
malizado. 


__q,2,-n 

l 2 + 2 2 + (-l) 2 


1 2 -1 \ 
sfZ ' yfê ’ \/6~) 


A noção de norma formaliza o conceito de comprimento. 


Exemplo : Vamos calcular a força (que é um vetor) de atração entre dois 
corpos de massas 2 e 5 unidades, colocados nos pontos (1, 3, 5) e (2, 1, 0), 
respectivamente, sabendo que a intensidade da atração entre eles é dada pela 

relação ^ onde mi é a massa do primeiro corpo, m 2 a do segundo e 

d a distância entre eles, e sabendo ainda que a força age na direção da reta 
que une os dois pontos. 



Vemos que F deve ser um vetor na direção e sentido de 


(2, 1, 0) - (1, 3, 5) = (1, -2, -5) e deve ter intensidade 


11(1, -2,-5)|| 2 30 3 


ou seja, F = — u, onde u é um vetor unitário na direção de (1, -2, -5). Por¬ 


tanto, 
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“■iR]7xf,r <1/V15 '- 2/ ^' 5 ' v,30 > 

e F = (1/V3Õ, -2A/3Õ, 5/\^3Õ ) = (1/3 \^3Õ, -2/3>/30 , 5/3v^3Õ ) 

Vejamos agora que a definição formal de norma tem realmente todas as 
propriedades que esperamos de uma noção de comprimento. 

Propriedades: Seja V um espaço vetorial com produto interno. Para quais¬ 
quer v, w em V e a E R. 


0 ||vil > 0 e ||v|| = 0 se, e somente se v = 0. 

tf) II0£ v|| = lai ||v|l 

iii) l<v, w)l < ||v|l ||w|| (Desigualdade de Schwarz) 

iv) ||v + w|| < ||vil + ||w|| (Desigualdade triangular) 

Prova: Você pode mostrar f) e ii ) a partir das propriedades do produto interno. 

iii) Sejam v e w em V com v # 0. (Para v = 0 vale a igualdade Kv, w)l = 

= IIv|| ||w|| = 0.) 

Para qualquer í GR, <fv + w, t\ + w) > 0, isto é, 

<v, v)f 2 + 2<v, w )t + (w, w) > 0 

Temos então um trinômio do 2? grau que deve ser positivo para qualquer va¬ 
lor de ri Como o coeficiente (v, v) de t 2 é sempre positivo (v # 0), o discri¬ 
minante A deve ser negativo: A - 4<v, w> 2 - 4<v, v)<w, w> < 0. 

Isto é, 4<v, w> 2 - 4 ||v|| 2 ||w|| 2 < 0, o que implica que l(v, w)l < II v|| ||w|| . 

iv) A desigualdade triangular você pode fazer como exercício. 


8.3.2 Ângulo entre dois vetores 


A desigualdade de Schwarz nos dá a possibilidade de definir ângulo entre 
dois vetores não nulos em um espaço vetorial V munido de um produto inter¬ 
no. Sejam v, w E V não nulos. Então 8.3.1 (iii) pode ser escrito como 


Kv, w)l 


llwl 


< 1 ou seja 


<v, w) 


w 


< 1, e portanto existe um ângulo 6 entre 


0 e 7 T radianos tal que cos 6 = | | ^ || , || « Este ângulo 6 é chamado ângulo en- 

v I w 


tre v e w. Observe que esta noçao é compatível com a noçao de ortogonalida- 
de pois, se <v, w) = 0, então cosí? = 0; logo 0 = n/2. 


Seria muito interessante se você verificasse agora que se considerarmos o 
plano R 2 ou o espaço R 3 com o produto interno usual, o conceito geral de 
ângulo aqui definido coincidirá com o conceito geométrico de ângulo entre dois 
vetores. 
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Exemplo : Sejam V = 4/(2, 2), as matrizes quadradas de ordem 2 reais e 
o produto interno dado pela expressão (comprove que realmente é um produto 
interno, testando as propriedades): 


a 

b 



c 

d 

’ 

g h ^ 


= a* + 2bf + 3 cg + dh 


Vamos calcular o ângulo entre as matrizes 
te produto interno. Então 


1 

0 



1 

1 


, segundo es- 


f'\ -r 


2 1 1 


\.o 1. 

5 

-i i [ 

i -r 


r 2 ii 


= 2 e 


0 1 


[-1 ij 


= VJõ 


Portanto, cos 6 = 1 /2 \Z~To' e assim, 6 = arccos 1/2 \/ 10 . 

Em 8.7 você poderá ver que a noção de correlação usada em estatística 
provém do conceito de ângulo entre dois vetores. 

Também utiliza-se o conceito de norma para caracterizar o tipo de base 
que, em geral, é mais conveniente quando se trabalha com um determinado 
produto interno. Numa base deste tipo as coordenadas de um vetor são dadas 
por um produto interno. 


8.3.3 Definição: Seja V um espaço vetorial com produto interno. Diz-se 
que uma base fi = {\ l , ..., v w } de F é ortonormal se for ortogonal e cada ve¬ 
tor for unitário, isto é. 


<Vi, v;> 


se i j 
se i = j 


Observe que se tivermos uma base ortonormal {\ x , . 
tes Xj de um vetor w = XjVx + ... + x n \ n são dados por 

<w,v/> 


v„}, os coeficien- 


X ‘ <Vi, V,-> 

Exempla. Seja V - R 2 e (,> o produto interno usual e 
0 = {(1, 0), (0, 1)} uma base ortonormal, temos x t = <v, e x 2 = <v, e 2 >. 


= <w, v,) . 
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8.4 PROCESSO DE ORTOGONALIZAÇÃO DE GRAM-SCHMIDT 


A partir de uma base qualquer de um espaço vetorial existe um processo para 
se obter uma base ortonormal. Inicialmente vamos dar uma descrição deste pro¬ 
cesso de ortonormalização para uma base 0 ~ {\ Í9 v 2 }. 

Seja vj = Vj. Precisamos encontrar a partir de v 2 um novo vetor v 2 or¬ 
togonal a vi, isto é, (v 2 , vi> = 0. Para isto tomamos vi - v 2 -^cvi, onde c é 
um número escolhido de modo que (vi, v^ = 0, isto é, <v 2 -cv^ v t > = 0. 


Isto significa que c 


ví> 

<vi,vi>' 



Ficamos então com 


vi = Vj 


Observe que \' 2 foi obtido de v 2 , subtraindo-se deste a projeção do vetor v 2 na 
direção de vi, 



<v 2 , v j) 

<v v;> 


v 


1 > 


e que v L e v 2 sao vetores ortogonais nao nulos. Podemos então normalizá-los. 


Ui 



V~2 

II vi || 


obtendo uma base 0 ' = {u t , u 2 } que é ortonormal. Como você pode afirmar 
que Ui e u 2 são LI? (Veja 8.1.5) 


8.4.1 Exemplo 

Exemplo 1: Seja 0 = {(2, 1), (1, l)} uma base do R 2 . Vamos obter a 
partir de 0 uma base ortonormal em relação ao produto interno usual. 
Sejam v t - (2, l)ev 2 = (1, 1). 

v'i = v, = (2, 1) 

V2 = V 2 - Cvi 

Como já vimos, a condição de que v 2 seja ortogonal a \[ implica que 

r = < V 2- V l> 

<v'i, v',) 


e, portanto, 


v 2 = v 2 


<v 2 , v'i> 


<v'i, v',) 

Normalizando estes vetores obtemos: 


(i, d 


<q d. (2, i)> 
((2, 1), (2, 1)> 


(2, 1) = (-L 4) 


Vl 

lv',1 


2 1 \ _ v 2 

V? ’ VI ) 6 Ul = IIvil 


7T-7t) 


Então, 0* = {uj, u 2 } é uma base ortonormal. 

O procedimento de ortogonalização de dois vetores pode ser generalizado 
para uma base 0 =: {vj, v rt }. Tomemos como no caso anterior 

VÍ = V! 

, i , -<v 2 ,vi> 

v 2 = v 2 - cv, onde c = j—, - r\ 

2 (v^vj) 


Então, vi é ortogonal a vi. 

Vamos procurar agora um vetor v 3 que seja ortogonal ao mesmo tempo a 
v i e vi . Por analogia ao caso anterior vamos estabelecer que vi = 

- v 3 - mv 2 - kv[ e determinar os valores de m e k tais que (vi, vi) - 0 e 
(vi, vi) = 0. Desenvolvendo estas duas condições, obtemos: 
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(v 3 , v'j> = 0 <=> <v 3 - mv 2 - fcvj, vi> = 0 

<=» <v 3 , v’,> - m(v 2 , vj> - A: < vi, vj> = 0 

Assim, como (v 2 , vj) = O, temos <v 3 , \' 2 ) = 0 se, e somente se 

. _ <va, ví> 

' <vi, v',> 

Da mesma forma, (v 3 , v 2 ) = 0 se, e somente se 

(v 3 , Vj> 
m = - - 

<ví, vi) 

E portanto, 

V L - V, - V2 > ; _ <V3, vj> v ; 

3 3 (vi, vi) 2 (vi, vi) 1 

Observe que k e m são os coeficientes de Fourier de v 3 com relação a \ 1 e a 

v 2 respectivamente, ou seja, v 3 é obtido de v 3 , subtraindo-se suas projeções 
sobre \\ e v 2 . 

Procedendo de maneira análoga, obtemos os vetores V 4 , v n . 

Assim, a partir de uma base ^ = iv A , v tt } de um espaço vetorial V , 
construímos a base ortogonal {vj, v n } dada por: 


Vi = Vi 


<V 2 , vi> , 


v 2 = v 2 - ~n -r v v i 

r _ „ <V 3 , V2> ■ <V3. V l> v > 

V3 = 3 " (vi, vi) V2 "<v;,vi> 1 


(v«, Vn- j) 


Vn ' (va-.Tvê:i> Vn ’ 1 


(v n , ví) 

(vi, vi> 


Este procedimento é conhecido como processo de ortogonalização de 
Gram-Schmidt. 

Se quisermos agora obter uma base ortonormal, basta normalizarmos os 
vetores v/. Isto é, tomando 

u j - , obtemos a base {u], u 2 , u n } de vetores ortonormais. 

Exemplo 2: Seja 0 = {(1, 1, 1), (0, 2, 1), (0, 0, 1)} uma base de R 3 . 
Vamos obter a partir de 0 uma base ortonormal em relação ao produto usual. 
Sejam v, = (1, 1, 1), v 2 = (0, 2, 1), v 3 = (0, 0, 1). 
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vl = Vj = (1, 1, 1) 

v i = V 2 - vi = (0. 2. I) - (_(°> 1 )■ 0 ■ 1 ■ (1 1 1) , 

< v i> v ‘> U ((1, 1, 1), (1, 1, 1)> U ’ ’ U 

= {0, 2, 1) (1, 1, 1 ) = (- 1 , i, o). 

y' = y _ <V 3, V 2 > . <v 3 , vi) , 

(vi, vi> 2 " (vi, v ;> V 1 

- ffi 0 l) (í®* 0* 1),( - 1, 1,0)) 

- (0 ’ °* 1} - (H7T7o)Th7T7o)) (ri. 1,0) - 

((0, 0, 1), (1, 1, D) ! 

( 0 , 1 , i), (i, i, j)) U, 0 - ( 0 . o, i) - o - j(i, 1 , 1 ) = 

= (-L -- h 

y 3 1 3*3^ 

Então os vetores normalizados são 


Ul = íkií = (t3 

Uj = lltii = (^TT-vV’ 0 ) 

Ü3 = ü%ii = ('vt’‘vT’ 2 ) 

e P' ~ {üi, u 2 , u 3 } é uma base ortonormal. 

Observe no exemplo que, dos vetores originais da base 0 o único que foi 
preservado, pelo menos em sua direção, foi o vetor Vj a partir do qual foi ini¬ 
ciado o processo de ortogonalização. Vale a pena notar que partindo da mesma 
base /? = {vj, v 2 , v 3 } poderemos obter uma outra base ortogonal ($ n iniciando, 
por exemplo, o processo de ortogonalização a partir de v 3 (v[ - v 3 =(0,0, 1)) 
Neste caso, os cálculos seriam simplificados pois v 3 já é um vetor unitário. 
Obteremos assim p" = (w L . w 2 , w 3 },onde o vetor cuja direção é preservada é 
v 3 , e não mais \ l . 

Exemplo 3: Seja j8 = {(1, 0), (0, 1)} a base canônica de R 2 . Vamos obter 
a partir de 0 uma base ortonormal em relação ao produto interno de R 2 , defi¬ 
nido por 

<Oi, ^i), (*2, y*y> = - x 2 y { + y x y 2 . 

Sejam v 2 —(1,0) e v 2 = (0, 1). 
vi = v, = (1, 0) 
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- <v 2 .v',> , , n n <(0. 1). (1, 0)) , n> - ío n + 

v 2 = v 2 - „, - x v, = (0, 1) - 777 m 77 7777 0 < ~ < U ’ ^ + 


<v’i, vi> 


<(1. 0), (1, 0)> 


1 


+ -| 0. 0) = ( y, 1) 

Normalizando estes vetores obtemos: 

t 

Vl 


U, = 


u 2 = 


l|Vl 1 

V2 


(^2 ’ 0) ) 


(2ã 

llv',11 V 2 


,xT2>) 


Assim, 0 ' = {uj, u 2 } é uma base ortonormal em relação ao produto interno 
definido acima. Observe que a base inicial j 3 é uma base ortonormal 
em relação ao produto interno usual de R 2 , mas não em relação ao produto 
aqui definido. 

8.5 COMPLEMENTO ORTOGONAL 


Consideremos um espaço vetorial V munido de um produto interno ( , ) e um 
subconjunto não vazio S de V . (S não é necessariamente um subespaço.) Con¬ 
sideremos então o subconjunto de V: 

S 1 = {v E V: v é ortogonal a todos os vetores de S}. 

Valem os seguintes resultados com relação a S. 

i) S*- é subespaço de V (mesmo que S não o seja). 

De fato, se x l e v 2 pertencem a 5^ e w é um vetor qualquer de S , en¬ 
tão vj i w e v 2 1 w e de 8.1.4. (/V) + v 2 1 w, ou seja, \ l + 

+ v 2 G S^, Analogamente, usando 8.1.4, (y) Àv { 1 w para qualquer X 6 R. 

ii) Se S é subespaço de V, então V - S<$> (veja 4.3.5). 

e é chamado complemento ortogonal de *5. Para mostrar isto, basta 
tomar uma base ortogonal de S {v h v 2 , ..., v*} (veja 8.4), estendê-la a 
uma base de K, {v!, V£W* + i , w w } e aplicar o processo de 

Cram-Schmidt, observando que v 2 , ..., v^ não mudam no processo. 
Obtém-se assim uma base ortonormal de V, (v^ v^, Vfç+i ,...»v rt }. Note 

que {vfc + i v„} é uma base de S 1 (verifique). Assim, 


V - [vj, v*] ® [v/fe+n v„] = iS © 5 1 . 



8.6 ESPAÇOS VETORIAIS COMPLEXOS - PRODUTO INTERNO 

No Capítulo 4, quando introduzimos espaços vetoriais reais, comentamos que 
se os escalares fossem números complexos, (C) teríamos um espaço vetorial 
complexo. 0 que queremos nesta secção é ressaltar um fato importante que 
ocorre com o produto interno num espaço vetorial complexo. 

Observe o que ocorreria se tivéssemos V, um espaço vetorial sobre C, mu¬ 
nido de um produto interno <, ) segundo a definição 8.1.1 e quiséssemos, dado 
v não nulo em V, calcular o produto <w, w) onde w - ix. Então, por um lado, 
pela condição (j) de 8.1.1, temos {w, w) > 0. Por outro lado, (w, w) = 

= <IV, IV) = «v, ix) - /(/V, V> = í 2 (v, V) = -l(v, v> < o pois <v, v) > 0. 

Então (w, w) deve ser ao mesmo tempo maior que 0 e menor que 0, o que é 

absurdo! Isto quer dizer que as duas condições f) (v, v) ^ 0 para todo v e 
iv) <v, w> = <w, v) para quaisquer v, w são incompatíveis quando estamos tra¬ 
balhando com espaços vetoriais complexos. Sendo assim, precisamos de uma 
nova definição. 

8.6.1 Definição: Seja V um espaço vetorial complexo. Um produto inter¬ 
no sobre V é uma aplicação 

<, ): V X V -> C 
(u, v) <u, v> 

que satisfaz as seguintes condições: 

0 <v, v) > 0 para todo v E V e <v, v> = 0 se, e somente se v = 0. 

ii) <au, v> = a<u, v), para todo a E C e u, v E V. 

iii) <Ui + u 2 , v) = (u { , v) + <u 2 , v) para todo u b u 2 , v G V. 

iv) <u, v) = <v, u) para todo u, v 6 V, 

Observe que a condição (ív) foi mudada em relação ao produto interno 
definido sobre R. Ela nos diz que <u, v) é o conjugado de <v, u>. 

Exemplo: Sejam V = C 3 , v l9 v 2 E V com x x = (x ly jc 2 , jc 3 ) e v 2 = 

- Í7i, 7i> 73)* A expressão 

<Vi, V 2 ) = Xipi + x 2 y 2 + x 3 y 3 

define um produto interno em C 3 . Verifiquemos a condição (ív). 

_ = <v 2 , v,>_= y 2 x 2 _+ y 3 x 3 j* y^Ti + y^T 2 + >^F 3 = y l * l + 

+ 72*2 + 73*3 = *l7l +*272 +*373 = < V 1>V 2 ) 

Um exemplo importante de espaço vetorial complexo é dado pelo con¬ 
junto das soluções de um sistema de equações diferenciais lineares. Ele será 
apresentado no Capítulo 12. 
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Do mesmo modo que definimos os conceitos fundamentais (norma, dis¬ 
tância, ortogonalidade etc.) num espaço vetorial real com um produto interno, 
podemos defini-los num espaço vetorial complexo. Por exemplo, a norma de 
um vetor v = (r,, r 2 , r 3 ) £ C 3 em relação ao produto interno dado no exem¬ 
plo anterior é 

||v|l = V<v, ~v> = Vx,3r, + x 2 x 2 + *3*3 = V lxii J + 1 * 2 * + 

Não vamos tratar mais detalhadamente sobre este assunto porque, neste livro, 
estamos mais interessados em espaços vetoriais reais. 


8.7 PRODUTO INTERNO E ESTATÍSTICA 

Uma situação que aparece freqüentemente na análise de experimentos e a se¬ 
guinte: verifica-se que o fenômeno estudado tem n possibilidades distintas S i, 
S 2 , >it> S n de se manifestar, cada uma delas com probabilidades Pi, 

Pi, Pn> respectivamente. O conjunto S = {S 3 , S n } e chamado espaço 
amostrai e o vetor p =(/?,, p n ) é chamado vetor de probabilidades. Por 
exemplo, no lançamento de uma moeda, podemos considerar S = (cara, coroai 
e p = (1/2, 1/2); no lançamento simultâneo de duas moedas, S = 

= {(cara, cara), (coroa, coroa), (cara, coroa)} e p = (1/4, 1/4, 1/2); num grupo 
de 3 pessoas podemos considerar S = {pessoa 1, pessoa 2, pessoa 3} e p = 

= (1/3, 1/3, 1/3) se cada uma delas tiver a mesma probabilidade de ser escolhi- 
clâ 3.0 acaso 

Se em um espaço amostrai S = {S,, .... S„}, com respectivo vetor de pro¬ 
babilidade p = Oi, ..., p„), associarmos, a cada elemento S, do espaço amos¬ 
tra!, um valor X,, teremos o vetor X = (T,, .... X„) que chamaremos de varia- 
vel aleatória. Vejamos alguns exemplos. 

8.7.1 Exemplos 

Exemplo 1: Se duas pessoas A e B fazem a seguinte aposta: lançam uma 
moeda e, se der cara, A ganhará 10 fichas e, se der coroa, B ganhará 10 fi¬ 
chas. Então teremos S = {cara, coroa}, p = (1/2, 1/2), a vanavel aleatória 
do ponto de vista de A será X = (10, -10) e a variável aleatória do ponto 
de vista de B será Y = (-10, 10). 

Exemplo 2: Num grupo de três pessoas A, B, C que pesam 70 kg, 80 kg 
e 50 kg, respectivamente, podemos considerar S = {A. B, C}, p 
= (1/3, 1/3, 1/3) e a variável aleatória X = (70, 80, 50). 



Exemplo 3: À situação escrita no Exemplo de 8.1.3 podemos associar o 
espaço amostrai S = {(cara, cara), (coroa, coroa), (cara, coroa)}, o vetor de 
probabilidades p = (1/4. 1/4. 1/2) e as variáveis aleatórias X = (10. 7. -9) que 
dá a aposta de A, e Y = (-10, -7, 9) que dá a aposta de B. 

Dado um espaço amostrai S = (S 1( ..., S„}, o vetor de probabilidades 
P = (Pi> •••> Pn) e uma variável aleatória X = (A’|. X n ), denominamos de 
valor médio de X (ou valor esperado) ao número 

X = Pi*i + PiX 2 + .. + Pn X n , 
de variança de X ao número 

F(X) = Pl (X J - X) 1 V ... + Pn (X n - xf 
e de desvio padrão de X ao número 

z>(X) = >/T(xj. 

A ligação destes conceitos com o conceito de produto interno é estabele¬ 
cida da seguinte forma: nas condições anteriores, consideremos em R* o seguin¬ 
te produto interno 

((Xj , (Vi, yn)} ~ P\X\y \ ••• + PnXnyn 

Temos então que, em relação a este produto interno 

X = <X, (1, i)> 

V(X) = (X - X (1, .... 1), X - X(U 1)> 

D(X) = \\X-X(U 1)11. 

Você pode verificar tranqüilamente estas igualdades. 


8.7.2 Exemplos 

Exemplo 1: O produto interno associado é 

(*2, ^2>> = \ x x x 2 +^1^2 

Então X = ((10, -10), (1, 1)) = y • 10 • 1 + (-10) • 1 = 0 e D(X) = 

= ||(10, 10) - 0(1, 1)|| = ||(10, 10)|| = V (1/2)10" + (1/2)10 2 = 10. (Faça o 
mesmo para a variável aleatória Y.) 

Exemplo 2\ O produto interno é 

<(•* 1 ,^ 1 , *l). (* 2 , V 2 , Z 2 )> = y*i*2 + ^>'l3'2 + 5 z i z 2 
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Então X = <(70, 80, 50), (1, 1, 1)> • 70 • 1 + \ • 80 • 1 +-j ■ 50 • 1 - 

_ ( isto é, o valor médio da função aleatória peso (o peso médio) é 200/3 

e o desvio padrão é 


D(X) = ||(70, 80, 50) —(1, 1, 1)11 = 11(10/3, 40/3, -50/3)11 * 
P/3)(10/3) 2 + (l/3)(40/3) 2 + (l/3)(-50/3)^ = jnAÍ 


Exemplo 3: O produto interno é 

1 1 1 

<(*, ,yi, z i), (x 2 ,y 2> z 2 )) = jx t x 2 + -^yiyi + 2 Z ‘ Z2 

Então X = <(10, 7, -9), (1, 1, 1)> = \ ■ 10 • 1 + ~ • 7 • 1 -y- 9 • l=-\ 

1 41 29 35 

D(X) = ||( 10 , 7, -9) - (- ^Xl. 1. 1)11 = IK - 4 - > T ’ ' T )h - l5 ’ 3 

(Compare com o Exemplo de 8.1.3.) 

Consideremos agora uma situação em que a um dado fenômeno associa¬ 
mos o espaço amostrai S = (Sj, S w }, o vetor probabilidade p = (pi,■ Pn )> 
e dois aspectos do fenómeno são representados por duas variáveis aleatórias 
X = (x Xj X n ) e Y - (Kj, .... Y n ). Estamos interessados em descobrir qual 
é a relação entre X e Y. Sejam íeF os valores médios correspondentes a X 
e Y. Considerando os vetores 

X - Y(l, ..., 1) = - X, X n - X) 

e 

Y - F(l, .... 1) = (Y l - Y, .... Y n - 7) 

Vejamos o que acontece se existir um número X tal que 

(Y l - F, ..., Y n - 7) = \(X, - X ,... -*) 

Neste caso podemos concluir que se X mudar, Y mudará proporcionalmente, 
ou seja, chegaremos à conclusão que os aspectos X e Y estudados estão forte¬ 
mente relacionados. Mas a existência deste número X é equivalente à condição 
de que os vetores tenham a mesma direção, ou seja, o ângulo 6 entre eles é 0 
ou 77, e portanto cos 6 = 1 ou -1. 

Assim, chegamos à conclusão, que o valor do co-seno do ângulo entre os 
vetores X - Y(l, ... 1) e Y - F(l, ..., 1) é uma medida da relação entre X e 
Y. A este valor os estatísticos chamam de coeficiente de correlação linear entre 
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X e Y e denotam-se por r(X, Y). Aplicando a fórmula do co-seno do ângulo 
entre dois vetores, temos: 

r(x Y) - 0. Y-F(l, ..., 1» 

i|X-AT(l, .... 1)11. ||Y- Y(\, 1)11 

Observamos que o produto interno indicado é aquele montado a partir do ve¬ 
tor de probabilidades e que quanto mais próximo r(X, Y) estiver de 1 ou -1 
mais podemos dizer que X e Y estão correlacionados linearmente. 

Exemplo 4: Consideremos um grupo de 10 alunos do qual conhecemos as 
notas de Matemática e Física dadas pela tabela abaixo. 


Aluno 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

C/J 

cd 

Matemática 

2 

8 

5 

7 

7 

5 

3 

1 

9 

9 

O 

Z, 

Física 

1 

9 

7 

2 

7 

4 

6 

3 

9 

7 


Queremos saber qual é a correlação entre os resultados nas duas matérias. Para 
isto, consideremos como espaço amostrai o conjunto dos alunos, numerados de 
1 a 10, S = {l, 2, . 10). Como a probabilidade de se considerar as notas de 

qualquer aluno é igual, o vetor probabilidade é, então, p = ( ^ ^ ), a 

variável aleatória que dá as notas de Matemática é X = (2, 8, 5, 7, 7, 5, 3, 1, 
9, 9) e a que dá as notas de Física é Y - (1,9, 7, 2, 7,4,6, 3,9, 7). Calculan¬ 
do, temos X = 5,6 e Y - 5,5. 

x- X{\, ..., 1) = (-3,6; 2,4; -0,6; ...; -4,6; 3,4; 3,4) 

Y - 5p,.... D= (-4,5; 3,5; 1,5; ...; -2,5; 3,5; 1,5) 

<X - Ap,..., 1), Y - Y (1,.... 1)> 2^4,9 

IIX • X (1,.... i)|| 2 » 7,4 e ||Y - y (1,..., l)ll 2 as 7, 2 

e o coeficiente de correlação é 

r(X, Y) as 0,67 


*8.8 O AJUSTE DE CURVAS E O MÉTODO DOS MÍNIMOS 
QUADRADOS 


Consideremos a experiência na qual se utilizou o circuito abaixo para 
determinar o valor da resistência R de um resistor. 


Blbtiotecátt 
Ciência A Jfecf 
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Feitas as medidas de corrente para vários valores de voltagem, os dados 
foram tabelados 


i =? corrente (Ampère) 

0,03 

0,06 

0,10 

0,16 

V - voltagem (Volts) 

10,0 

18,0 

32,0 

40,0 


e a seguir colocados em um gráfico 


V i 
40 

32 


18 

10 


--r 




0,03 0,06 


! ! 

_i-1— 

0,10 0,16 


A partir destes dados, se quisermos obter a relação entre corrente e 
voltagem, inclusive para pontos intermediários ou exteriores aos tabelados, 
deveremos propor uma curva (uma função) que se ajuste aos pontos tabelados. 
A proposta de tal função deverá levar em consideração que: 

i) Qualquer medida contém um erro (inerente ao aparelho de medição, falh?» 
do operador etc.) 

ii) Pode já existir algum argumento teórico ou de bom senso que nos indique 
qual deve ser o aspecto analítico da função. 

O item (/) nos mostra que exigir que a curva procurada passe por todos 
os pontos não é somente desnecessário mas, provavelmente, errado, enquanto 
que o item (») nos mostra que deveremos ter alguma argumentação convim 
cente para fazer previsões. Juntos, estes itens mostram que entre todas as 
funções com um determinado aspecto analítico deveremos procurar aquela 
que, em um certo sentido, melhor se ajuste aos pontos da tabela. Na 
experiência que estamos considerando, por exemplo, existe uma fundamentação 
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teórica que relaciona a corrente com a voltagem: V = R • i, isto é, o gráfico 
de V em função de i deve ser uma reta passando pela origem e com certa 
inclinação R que mede a resistência. Devemos, portanto, estabelecer um 
mecanismo que forneça o melhor ajuste” aos dados de que dispomos. 

Como fazer isto? Uma idéia é a de que a reta procurada deve ser tal que 
torne pequenos os desvios (isto é, a diferença entre o valor dado na tabela e o 
valor dado pela reta) em cada um dos pontos da tabela. Mas como garantir 
isto? O método que escolheremos será exposto na secção seguinte. 



8.8.1 O Método dos Mínimos Quadrados 

Observemos inicialmente que se temos funções tabeladas 



*1 

x 2 

*3 

... 

X n 


fc) 

Axi) 

Âx 2 ) 

Ax 3 ) 

... 

Ax n ) 



de forma que os valores da variável independente x i9 x 2 , x n são sempre os 
mesmos, cada uma dessas funções pode ser considerada como um vetor de um 
espaço vetorial (o das funções definidas nos pontos x l9 x 2f x it ). Tal espaço 
é isomorfo ao K n (veja 5.3.12) e nele é que trabalharemos. 

Vamos generalizar um pouco a situação da introdução para podermos 
utilizar a linguagem da Álgebra Linear é resolver o problema. 

Suponhamos que conhecemos o aspecto analítico de duas funções £t(x) 
e £2 00 e que queremos “aproximar” uma dada função /(x) por uma 
combinação linear de gi(x) e g 2 ( jc), istoé, queremos achar coeficientes Ci e c 2 
tais que a função 

g(x) = Cigi(x) + c 2 g 2 (x) 

seja uma “boa aproximação” para f(x). Por exemplo, se £i(;c) = 1 e 
# 2 (a) = x, estaremos aproximando f\x) por uma função afim g(x) = c x + c 2 x\ 
sc £i(.x) = sen* e g 2 {x) = cosx estaremos aproximando por 
g(x) - Ci sen x 4- c 2 cos x etc. 
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Vamos introduzir agora uma noção de distância entre funções. Para 
isto, lembramos que se tivermos um produto interno <,> num espaço 
vetorial podemos construir uma noção de distância entre dois elementos v, e 
v 2 como a norma da diferença entre eles. 


distância entre ^ e v 2 = ]| - v 2 ll = 



Definimos, então, o seguinte produto interno (verifique se realmente é 
um) no espaço vetorial definido no início da secção. 


8.8.2 <fi,h> = * A(^i) + /i(*2>* / 2 (xj) + -. +/i(*n) */!(*«) 

= £ /iOi) •/iOu) 
i=l 

Com relação a tal produto interno a distância entre duas funções é dada 
pela expressão 

8.8.3 n/i-/ 2 ii = 

Observe que a expressão dentro do radical é exatamente a soma dos 
quadrados dos desvios que existem entre fi(x) e f 2 [x) em cada ponto X{ da 
tabela. 

Lembrando que se sabemos que a soma de certos números positivos é 
pequena então podemos concluir que cada um desses números é pequeno, 
teremos a chave para descobrir os coeficientes c x e c 2 : devemos calcular a 
distância entre f{x ) e g(x) - Ci£i(*) + a q ua l> evidente mente, será 

função de c t e c 2 , e então minimizá-la seguindo os procedimentos normais de 
minimização de funções de várias variáveis (consulte Leithold, L., O Cálculo 
com Geometria Analítica”, Edit. Harper & Row, SP, 1977). 

Seguindo este caminho teremos a distância entre f{x) e g(x) dada por 

D(c lf c 2 ) =11/- Cxgi - c 2 g 2 \\ = 


Achando o ponto (c u c 2 ) que minimiza tal função (isto é, achamos os pontos 

críticos q e _^_ = o etc.) teremos que os valores c x e c 2 que 

dc x oc 2 

fornecem a função g{x) = c ígí (x) + c 2 g 2 {x) que melhor aproxima f(x) devem 
satisfazer o sistema linear: 
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£ gl(Xi)gl(Xi) j Ci + í £ gi(Xi)g 2 (Xi) j c 2 = £ gi(xi)Axi) 


£ g 2 Íxdgl(*i)\ci + £ g*(Xi)g 2 (Xi) j c 2 = £ g 2 (Xi)AXi) 


ou, lembrando a definição do produto interno 8.8.2. 


8.8.4 f <gi,gi> c t + <g l ,g 2 > c 2 = <g t ,f> 

L<gí, gi > ci + <g 2 , g 2 > c 2 = <g 2 ,f> 

Como conhecemos a expressão de £j(x) e £ 2 (jc), os valores de j\x) nos 
pontos xi da tabela e os produtos internos só dependem dos valores das 
funções nestes pontos, podemos resolver o sistema e obter os valores de C| e 
c 2 . Este procedimento é chamado o método dos mínimos quadrados para 
ajuste de curvas. 

Exemplo : Ajustar uma função do tipo g(x) = a + bx aos pontos da 
tabela 


X 

0 

i 

2 

Ax) 

u 

0,1 

-3,1 


Temos g(jc) = a * 1 + b ♦ x 2 , ou seja, £i(x) = 1 e g 2 (x) - x 2 
Então <g ít gt >= 1*1+1*1+1*1=3 

<*!,*2> = <*2.*I>=1 -0 2 +l • 1 2 + 1 * 2 2 = 5 
<g2,g2> = 0 2 - 0 2 + l 2 • 1 2 + 2 2 . 2 2 = 17 
<gi.f >« 1 • 1,1 + 1 • 0,1 + 1 • (-3, 1) = -1,9 
<g 2 ,f > = 0 2 . M + l 2 - 0,1 + 2 2 * (-3,1) = -12,3 

Daí f 3a + 5b = - 1,9 
l 5a + 17b = -12,3 

Resolvendo temos a = 1,12 e b s - 1,05. Portanto, entre as funções do tipo 
a + bx 2 a que melhor se ajusta aos dados da tabela é 0,912 - 0,927x 2 . 
(Trace os gráficos.) 

Podemos interpretar intuitivamente a fórmula 8.8.3 (na verdade a 
argumentação a seguir pode ser demonstrada rigorosamente). 

Observe a Figura 8.8.1 onde / representa a função tabelada, g x e g 2 as 
funções cujo aspecto analítico conhecemos e o plano representa o subespaço 
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gerado por g x e g 2 . A função g = c^i + c 2 g 2 procurada é o ponto do plano 
que está à menor distância de / 



Intui ti vamente sabe-se que tal ponto é o pé da perpendicular ao plano 
(isto pode ser provado rigorosamente). Portanto o vetor f - g é perpendicular 
a gi e g 2 (que estão no plano). Devemos ter então 


0 = <gi>f-g> = -ci<gugi>-c 2 <g l9 g 2 > + <g u f> 

0 = <g2>f-g> = -C í <g 2 ,g 1 >-C 2 <g2>g2>+<g2,f> 

que são exatamente as relações de 8.8.3. 

Toda a argumentação anterior pode ser facilmente repetida no caso de 
termos um número k (k - 1, 2, 3, ...) de funções £;(*) ao invés de apenas 
duas. Formalmente: 

8.8.5 Se quisermos achar coeficientes ci, c 2> ..., c k tais que a função 
g(x) = Cigiix) + c 2 g 2 (x) + ... + Ckgk( x ) é aquela que melhor aproxima uma 
função tabelada f{x) no sentido do método dos mínimos quadrados , tais 
coeficientes satisfazem o sistema linear 


r + <*n c 2 + ••• + <*ikCk = b x 
a kl c í + a k2 c 2 + ... + a kk c k - b k 


onde aq - < gj, gj > 
bi = < git f ^ 

e <, > é o produto interno dado por 8.8.2. 


8.8.6 Exemplos 

Exemplo 1 : Vamos resolver o problema do início da secção. Nesse 
problema a corrente i faz o papel de x, k - 1 e g x (i) - i Segundo o resultado 
de 8.8.5, R deve satisfazer 

< K g\ > = R < gu gi> 

Como <*!,*,> = (0,03) 2 + (0,06) 2 + (0,10) 2 + (0,16) 2 = 0,0401 

< V, gi > = 10.0,03 + 18 * 0,06 + 32 • 0,10 + 40 • 0,16 = 10,98 
10 98 

Portanto R = s 273,81 ohms 

Exemplo 2: Sabendo que a população de uma certa localidade variou 
com o tempo segundo a tabela 


Ano 

1940 

1950 

1960 

1970 

População X 10 4 

1.0 

1,5 

1,8 

2,0 


aproximando os pontos da tabela por uma função do tipo (t = tempo) 

g(t) = a + bt + ct 2 , 
qual será a população em 1990? 

No contexto de 8.8.5 teremos k = 3, g x (t) = 1, g 2 (0 ® t> g3Í0 = t 2 . 
Além disso, para os números se tomarem menores, identificaremos t = 4 com 
1940, t = 5 com 1950 etc. Dessa forma 1990 será representado com t = 9. 

Então: < g u g v >a + < g lf g 2 >b + < g x , g 3 >c = < g u f> 

<g2, gi >a + <g 2 , gi >b + <g 2 , g 3 >c = <g 2 > f> 

<g 3 , gi >a + < g 3 , g 2 >b + < g 3 , g 3 >c = < g 3 , f> 

< gi,gi >~4,<gi,g2>^ <g2,gi> = 22 ,<g 2 >g 2 > = 126, 

< £i,gs> = < g 3 ,gi> = I16,<g 2 ,g 3 >=<g 3 ,g 2 >= 748, 

< £3,£3 > = 4578, <giJ> = 6,3, <g 2 J> = 36,3 ,<g 3 J> = 216,3 

Substituindo e resolvendo o sistema temos a = - 2,415, b - 1,155 e 
c = -0,075. Assim ^(í) = -2,415 + 1,155 t- 0,075r 2 e a população prevista 
para 1990 será dada por g{ 9) = 1,905, ou seja, 1,905 • 10 4 = 19 050 pessoas. 

Uma vez entendido o ponto de vista técnico, vamos discutir a confiabi¬ 
lidade dos resultados obtidos. Em particular, você confia no resultado do 
último exemplo? Por que foi proposta uma função do tipo g(r) = a + bt + ct 2 
para aproximar a tabela e não outra? A resposta a esta questão é dada no 
item (ii) discutido no início da secção, isto é, devemos ter alguma funda- 
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mentação teórica sobre o fenômeno que estamos estudando (no caso dinâmica 
populacional) para então propor o tipo de função. Na verdade a função 
quadrática proposta no exemplo não satisfaz a este requisito; ela foi proposta 
apenas para exercitar a técnica. Um tipo de função que descreve um pouco 
melhor a dinâmica populacional, apesar de não levar em conta uma série de 
fatores, é g(í) = ae , com a e b a serem determinados. Vamos refazer o 
problema nesta nova condição, lembrando-nos que, nos problemas de previsão, 
a não confiabilidade dos resultados não é devida a Matemática, mas sim a 
quem propôs o modelo teórico. 

Exemplo 3: No exemplo anterior, prever a população aproximando os 
pontos da tabela, utilizando uma função do tipo g(t) = ae bt . 

Notamos que na forma como foi apresentado o problema não 
poderemos usar diretamente 8.8.5, pois a função g(?) proposta para aproximar 
não é urna combinação linear de funções conhecidas. Vamos colocá-la noutra 
forma. Utilizando o símbolo = para “aproximadamente”, observamos que o 
problema original é achar a e b tais que 

f{t) = a • e bt 

Aplicando o logaritmo neperiano a ambos os membros, temos 

F\t) =ln/(0 = 1 na + bt 

Chamando c x - \na, c 2 = b, g\(t) = 1 e g 2 (0 = t , temos 
InAO = c x g x (i) + c 2 g 2 {t) 

Isto é, o problema fica no contexto de 8.8.5 se aproximarmos não a tabela 
original, mas a tabela modificada. 



t = 4 

t = 5 

t = 6 

t-1 

Ano 

1940 

1950 

1960 

1970 

m = \nAt) 

0,0 

0,405 

0,588 

0,693 


Assim < g\, > * 4, < gi, gi > = < g 2 > g i > = 22, < g 2i g 2 > - 126 

< g u F > = 1,686,< g 2 , F > = 10,404 
Temos então o sistema 

r 4c i + 22c 2 - 1,686 
22c i + 126 c 2 = 10,404 

que resolvido fornece C\ = 0,226, c 2 = - 0,822. Donde a = e Cl = 0,439 e 
b = c 2 = 0,226. Assim g(t) = 0,439e 0>226í e g(9) = 3,356. A população prevista 
será de cerca de 3,356 • 10 4 = 33 5 60 pessoas. 
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Compare este resultado com o do Exemplo anterior. Qual deles você 
acha melhor? Por quê? 

Em geral sempre que temos uma proposta para aproximarmos uma tabela 
por uma função não linear fazemos certas modificações para obter uma 
situação linear, e então usamos 8.8.5. 

Uma palavra final deve ser dada com relação à nomenclatura. Os estatísticos 
ao utilizarem o método dos mínimos quadrados chamam-no de análise de regressão. 
Assim, fazer regressão linear, quadrática ou exponencial significa aproximar os 
dados de uma tabela por uma função do tipo a + bx, a + bx + cx 1 ou a ♦ e bx , res¬ 
pectivamente, utilizando o método dos mínimos quadrados (8.8.5). 

8.9 EXERCÍCIOS 

1. Comprove que as funções definidas nos exemplos do parágrafo 8.1 são pro- 
dutos internos. 

2. Seja V = R 2 . Sejam v, = (* lf yi ) e v 2 = (x 2 ,y 2 ). Se /(v,, v 2 ) = 

= 2 x 1*2 + x iyi + x 7 y i + mostre que / é um produto interno. 

3. Mostre a desigualdade triangular. (Veja 8.3.2 - iv) (Sugestão: ||v + w|| 2 = 

= (v + w, v + w>; desenvolva e use a desigualdade de Schwarz - 

8.3.2 - iii ). 

4. Seja 0 = {(1, 2), (2, 1)}. Use o processo de GranvSchmidt para achar uma 
base ortonormal 0' de R 2 em relação ao produto interno usual. 

5. Seja 0 = {(1, 1, 0), (1, 0, 1), (0, 2, 0)}. Ache uma base ortonormal 0' de 
R 3 , em relação ao produto interno usual. 

6. Seja 0 = {(-1, 1), (1, 1)}. Ache uma base ortonormal 0' de R 2 , em relação 
ao produto interno definido no Exercício 2. 

7. Determine uma base ortonormal (em relação ao produto interno canônico) 
para o seguinte subespaço de R 3 : 

V m {(x, y, z) e R 3 ; x -y + z = 0} 

8. Seja W C R 3 o subespaço gerado por (1,0, 1) e (1, 1, 0). 

a) Considere em relação ao produto interno canônico. Encontre uma 
base para 

b) A mesma pergunta anterior se é considerado em relação ao produto 
interno <(x, y,z), {x\y\z) > = 2 x • x +y • y +z * z\ 
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9. Seja T: R 3 -*• R 3 dada por T(x,y, z ) = (z, x-y, -z) e seja W = ker T. 

a) Encontre uma base ortonormal para ^(em relação ao produto interno 
canônico de R 3 ). 

b) O mesmo em relação ao produto interno 

<(x, y, z), (V, /, z) > = 2x • x + y •/ + 4z ♦ z' 

10. Considere o subespaço W de R 3 gerado por = (1, 0, 0), v 2 = (0, 1,^1) e 
v 3 = (1, - 1, - 1). Sendo <, > o produto interno canônico (a) Ache W ; 

(b) Exiba uma transformação linear T: R 3 -» R 3 tal que lm{T) = W e 
kertT) = W L . 

11. Considere em R 3 o produto interno 

<(x, y, z), (x\ y, z')> = x ♦ x' + 5y ■ / + 2z • z 

a) Verifique se realmente é um produto interno. 

b) A partir da base {(1, 0, 0), (0, 1, 0), (0, 0, 1)} ache uma base orto- 
normal 

12. Seja ?2 o espaço das funções polinomiais reais de grau menor ou igual a 
dois. Definimos em P 2 

</,*>=/’ m-m* 

Considere W o subespaço de P 2 gerado pelos vetores p{t) = 1 e q(i) = 1 - 1. 

a) </, g > é um produto interno? 

b) Se a resposta de ( 0 ) for afirmativa determine uma base ortogonal para W. 

13. Seja V = R 3 e S = {(1, 0, 1), (1, 1, 0), (2, 1, 1)}. 

a) Encontre 5^. ^ 

b) Encontre uma base ortogonal para S e S . 

c) Se S fosse [(1, 0, 1), (1, 1. 0), (2, 11)], qual seria S 1 ? Neste caso, en- 
contre uma base ortogonal para S e S . 

14. Seja A = [a x \j\ n xn uma matr * z quadrada. Definimos o traço de A, 7V(A), 

n 

por X! a ü 
i= i 

a) Calcule Tr ^ 

b) Tr {A • B) = 7r(B • A)? 
e) Tr{ A) = 7>(A')? 


d) Tr{ A) = (rKA- 1 ))- 1 ? 

e) Tr (A • B) = 7>(A) • 7r(B)? 
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15. Sejam A e B matrizes de M(l, 2). Define-se 

< A, B > = 7>(B f • A) 

a) Verifique que < A, B > é um produto interno. 

b) Exiba uma base ortonormal segundo este produto interno a partir da 

K-.. ( 1 °\ (l iWl 0\ /I 1\ 


16. Um 


corpo é deslocado em linha reta do ponto (-1, 3) até o ponto (5, 2) 

uma fnrca constante F= Onal á A trnkoUirt —_ 4^0 


17. Podemos definir uma “distância” entre dois pontos P = (Jt|ji)eQ = 

= Oi > y-i ) do plano por d(P, Q) = lx 2 - x, I + \y 2 - y x | (veja a Figura 
8.9.1). Verifique se a aplicação dada por 

<(*l,.Pl), (*2, yi)) = ^(P, 0) 

define um produto interno no plano. 


Figura 8.9.1 


18. Uma partícula percorre a trajetória OABO onde O, A e B são os pontos 

(0, 0, 0), (1, 1, 0) e (0, 1, 1) respectivamente (a unidade de comprimento é 
o metro) com velocidade constante de 1 m/seg. Se um campo elétrico induz 
uma força na partícula dada por 

(1, 1,1) se 0 < t < 1 

(1, 1,-1) se 1 « t < 2 

f = < (1, -1, 1) se 2 < t < 3 

(-1,1,1) se 3 « t < 4 

(-1, -1, -1) se t> 4 

calcule o trabalho realizado para percorrer esta trajetória uma vez. 

19. Em relação ao produto interno do Exemplo de 8.3.2 calcule x de modo que 

e * _1 tenha uma medida de 90°. 

2 X 
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*20. Duas pessoas, A e B, fazem a seguinte aposta. A joga uma moeda ate que 
apaieça cara. Se ela ocorrei na primeira jogada, B pagará 1 ficha; se nao 
aparecer cara na primeira e sim na segunda jogada B pagará 2 fichas; se 
ocorrer cara pela primeira vez no terceiro lance, B pagará 4 fichas etc. Em 
geral, se os primeiros n lances forem coroas eo(n + l>ésimo lance for 
cara, B pagará 2 n fichas, onde n < 5, supondo-se que 5 seja o limite má¬ 
ximo de lances. Se todos os cinco lances forem coroa, B pagará 50 fichas. 
Antes de começar, A paga a B 5 fichas. Quem levará vantagem neste jogo. 
Quanto A deveria pagar a B no início do jogo para tomá-lo justo? 


*21. Dez pares de observações foram feitas das variáveis X e Y, resultando no 
gráfico abaixo. 


Figura 8.9.2 


70 

60 

50 

40 

30 

20 

10 


a) Qual é a correlação entre as duas variáveis? 

b) Se as unidades do eixo-x fossem 10, 20 etc., qual seria a correlação? 
*22. A tabela seguinte lista o número de acidentes em veículos motorizados na 

Grande São Paulo em alguns anos entre 1960 e 1978._ 


Ano 

Total de acidentes 

Acidentes por 10 000 veículos 

1960 

16 600 

1988 

1965 

19 800 

1587 

1970 

20 800 

1429 

1975 

26400 

1693 

1976 

27 200 

1718 

1977 

27 400 

1697 

1978 

29 200 

1746 

1 _—- 1 
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a) Compute a regressão linear de acidentes no tempo. Use-a para prever o 
número de acidentes em 1980. Isto recebe o nome de análise de série 
temporal (i.e. regressão no tempo para prognóstico futuro). 

b) Compute a regressão quadrática do número de acidentes por 10 000 veí¬ 
culos no tempo. Use esta nova regressão para prognosticar o número de 
acidentes em 1980. 

c) Compare estes resultados. Em qual você está propenso a acreditar e 
por quê? 

Sugestão ; utilize os resultados de 8.8. 

*23. Os dados abaixo representam a produção de soja durante vários anos em 
um determinado terreno. 


Ano 

Produção (toneladas) 

1969 

96,2 

1970 

92,0 

1971 

90,1 

1972 

89,0 

1973 

86,8 

1974 

82,6 


Utilizando seus conhecimentos teóricos, experimentais e bom senso, faça 
uma previsão da produção em 1980. 

Supondo-se que a produção é economicamente inviável se for inferior a 66,0 
toneladas anuais, a partir de que ano deveremos mudar a espécie plantada? 
Faça uma crítica da sua proposta. 

Sugestão: utilize os resultados de 8.8. 


8.9.1 Respostas 



6. {(-i, 1), (0. 1)} 


10. a) W^- é formado pelos vetores ortogonais a todos os vetores de W . Para 

saber se um vetor está em W*- é suficiente, porém, que ele seja ortogonal 
aos vetores de uma base de W (por quê?). Achamos então uma base de 
W , obtendo: 


W= [( 1 , 0 , 0 ), ( 0 , 1 , 1 )] 
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Portanto = {a, y,z) I < {x, y, z), (1,0, 0) > = 0 e < (x, y, z), 

( 0 , 1 , 1 )> = 0 } 

Mas < (x, y, z), (1,0,0) > = x = 0 
<(x,y, z), (0, 1,1)> = y +z = 0 

Assim W*- - {x, y, z) \ x = 0 e y = -z} 

= {(0, -z, z), z € R} 

= {z • (0,-1, 1), z€R} 

= 1(0,-1,1)] 

b) Para que ker(T) = IV- devemos ter T(0, -1,1) = (0, 0, 0). Por outro 
lado para que Im ( T ) = W cada um dos vetores (1, 0, 0) e (0, 1, 1) deve 
ser imagem. Observando que {(0, -1, 1), (1, 0, 0), (0, 1, 1)} formam 
uma base de R 3 (por quê?) e que uma transformação linear fica determi¬ 
nada pelo o que ele faz numa base, podemos escolher T tal que 

T(0, -1,1) = (0, 0,0), m, 0,0) = (l, 0,0) e 7X0, 1, 1) = (0, 1, 1) 

A seguir achamos a expressão de T(x, y, z). 

13. a) S L = [(-1, 1, 1)] 
b) S não é subespaço 

C) s = [(I, 0, 1), (1, 2, -1)] e S 1 = ((-1, 1, 1)3 

14. a) 7 b) sim c) sim d) não e ) não 


»' 


1 2 

\T~& \TT> 


0 

0 


1 1 

'rs rs 

° 7 t 

- J 

> 

_° -7Z_ 


1 

0 

> 

i 

O 

i _ 


16. 16 

18 . T= 10 - l\fí 

19. * = -15 

20. B leva vantagem. 3,69 fichas. 

21 . 0,82 
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TIPOS ESPECIAIS DE 
OPERADORES LINEARES 


9.1 INTRODUÇÃO 

Neste capítulo vamos estudar dois tipos especiais de operadores. Tais operado¬ 
res são importantes, não apenas pelas propriedades interessantes que eles possu¬ 
em, mas também por serem os que mais aparecem em aplicações práticas e, 
assim sendo, merecem um estudo um pouco mais apurado. Os operadores auto- 
-adjuntos aparecem naturalmente em problemas que envolvam simetria e em 
outras situações corno em Mecânica Quântica, onde estão normalmente associa¬ 
dos a considerações sobre energia do sistema. Outro tipo de operadores, os or¬ 
togonais , aparecem na Dinâmica de Corpos Rígidos, ligados a problemas de ro¬ 
tação e translação. No Capítulo 10 você verá o uso desses operadores no estu¬ 
do de cônicas e quádricas. 

Iniciamos o estudo desses operadores fazendo algumas observações. 

A primeira delas diz que, ao trabalharmos com base ortonormal, o produ¬ 
to interno poderá ser expresso numa forma canônica (teorema 9.1.1), As 
outras versarão sobre propriedades de certos tipos especiais de matrizes que 
caracterizarão os operadores a serem estudados. 
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9.1,1 Teorema: Sejam V um espaço vetorial real com produto interno 
( i ) e et = {u] , u„} base ortonormal de V. Então, se v e w são vetores de 

V com 

: , temos 
*■_ 

(v, w) = x x y x + X 2 y 2 + — + x nyn- 

Em outras palavras, ao trabalharmos com uma base ortonormal, para efe¬ 
tuar o produto interno de dois vetores basta multiplicar as coordenadas corres¬ 
pondentes e somar. 



Prova: \ ~ x x Uy + x 2 u 2 + ... + x n u n 

e w = y x u { + y 2 Ui + - + yn^n 

(u, w> = <A*iUi + ... + y x Ui + ... + yn u n) 

= (x , Uj + ... + X„\X n , ^iU!> + <x,u, + ... + X„u „, + 

+ ... + <XiU, + ... + X„U„, y n ^n> 
n n n 

= £ Xiyi <u,-, u i> + _ 

i=l í=l <=l 

n n 

= Z S Xô>i <U/ ’ u/> ' 

/= 1 /=1 


^ Xjy 2 (u,-, u 2 > + ... + y^x x y n (u,-, u„> 


Mas como (u*, Uy> = 


f 0 se i =£ / 
|^1 se / - / , 


os únicos termos não nulos são aqueles onde i - j. Logo, 


<U, w) = x x y x + x 2 y 1 + ... + x nyn * 

A seguir introduziremos as matrizes que estarão associadas aos operadores a 
serem estudados. 


9.1.2 Definição: Seja A uma matriz n x n real e A' sua transposta. 

úí) Se A — A f dizemos que A é uma matriz simétrica . ^ 

b) Se A - A' = A' • A = I (ou seja, a inversa de A é A'), dizemos que A 

é uma matriz ortogonal. 

No Capitulo 1 já vimos exemplos de matrizes simétricas. Quanto à se¬ 
gunda definição, as matrizes ortogonais determinam um subconjunto das matri- 
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zes inversíveis. Efetivamente a relação entre matrizes simétricas, inversíveis e 
ortogonais é indicada pela figura abaixo. 



Figura 9.1.1. 


M : matrizes 
Afl : matrizes inversíveis 
ATO: matrizes ortogonais 
MS : matrizes simétricas 


Como exemplos de matrizes ortogonais temos: 
Exemplo: 



Para verificar isto basta multiplicar cada uma pela sua transposta obtendo 
assim a matriz identidade. Calculando temos, no primeiro caso: 

cos 9 -sen 6 cos 9 sen 0 
sen 6 cos 0 _-sen 6 cos B 

cos 2 0 + sen 2 0 0 1 0 

0 sen 2 9 + cos 2 (9j “ j_0 1 

Observe que a transformação associada à primeira matriz é uma rotação. (Veja 
5.2.4.) 

Consideremos agora três propriedades das matrizes ortogonais. 

9.1.3 Teorema: Seja A uma matriz ortogonal. Então detA = ±1. 

Prova: Como A é ortogonal, A • A' = I- 

Então det (A • A ’) = det I e (det A) (det A') = 1 

Mas det A = det A'. 

Assim (det A) 2 = 1, ou seja, det A = ±1* 
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9.1.4 Teorema: Uma matriz é ortogonal se e somente se as colunas 
(ou as linhas) sào vetores ortonormais. 

Prova: Seja 



Na primeira parte da prova queremos mostrar que se A é ortogonal isto im 
plica que 



são ortonormais (o mesmo vale para as linhas). Para isto, façamos o produto 
de A pela sua transposta. 



pois A'A = I. 

Observamos que a 2 u + ... + a 2 n j 


1. Mas isto quer dizer que 



é unitário. 


Da mesma forma, percorrendo a diagonal principal, vemos que cada vetor-co- 
luna da matriz A é unitário. O que encontramos saindo desta diagonal? . O 
elemento na posição /, / (/^/) é a xi a 1; - + ... + a n p n j e seu valor deve ser zero. 


Mas isto diz que o produto interno de 


é nulo, ou seja, os 
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vetores-coluna são dois a dois ortogonais quando i /. 

Está terminada, então a primeira parte da prova. Ainda falta provar que 
se os vetores-coluna (linha) de uma matriz forem ortonormais, a matriz será 
ortogonal. Vamos deixar esta prova para você, já que ela é apenas uma adapta¬ 
ção da prova dada acima. (Veja o Exercício 4 da secção 9.4.) 

Apresentaremos agora uma situação onde as matrizes ortogonais ocorrem 
naturalmente. 


Exemplo : Seja V = R 2 e a = {(1, 0), (0, 1)} e 0 = {(cos 0, - sen 0 ), 
(sen 0, cos 0)} bases ortonormais. Calculemos a matriz de mudança de base 

[7]jj. (Veja 4.7.). Como 0 é uma base ortonormal, podemos encontrar as coor¬ 
denadas dos elementos da base a em relação a 0 por meio dos coeficientes de 
Fourier. 

n ru <(1? 0), (cos 0, -sen 0)> , A 

(1, 0 = Tí - ^ f -ã--—^rr(cos 0, -sen 6) + 

<(cos 0, -sen 0), (cos 0, -sen 0)> 

<(1, 0) (sen 0, cos 0)) , n m 

+ —“Ti-( sen cos 0) = 

<(sen 0, cos 0), (sen 0, cos 0)> 

= cos 0 (cos 0, -sen 0) + sen 0 (sen 0, cos 0) 

Analogamente, 

(0, 1) = -sen 0 (cos 0, -sen 0) + cos 0 (sen 0, cos 0) 


(sen 0, cos 0) 


r na _ cos 0 -sen 0 

0 sen 0 cos 0 

Observe que esta matriz é ortogonal (veja o Exemplo de 9.1.2). Tal resultado 
vale em geral. 


9.1.5 Teorema: Se V é um espaço vetorial com produto interno eae^ 
são bases ortonormais de V, então a matriz de mudança de base [/]^ é uma 

matriz ortogonal. 

Prova : Sejam a = {vj, v„} e 0 = {wj, ..., w rt } e 
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Como 0 é base, existem números a,y tais que 

v, = a,,w, + ... + a nl w„ 


V rt = ffirtWi + ... + a„„ w n 

Mas a é ortonormal e por isso cada v f - é unitário. Isto é, 1 = <v/, v/). Além 
disso, P é ortonormal e assim podemos encontrar <v f -, v/> multiplicando as coor 
denadas. (Veja 9.1.1.) Portanto 1 = a 2 u + ... + a 2 ni . Em outras palavras, cada 

vetor-coluna de [/]^ é unitário. Mostraremos agora que estes vetores são orto¬ 
gonais e portanto t/lo é ortogonal. (Veja 9.1.4.) 

Como v/ e vy são ortogonais quando / ^ 0 = <v/, vy> = + ■* + a ni a nj > 


a M 


"•/ 


e 


a ni J 


Jnj_ 


ou seja, 

Assim a afirmação de que 


são ortogonais sempre que i =£ y. 
[/]^ é ortogonal é verdadeira. 


Observamos, então, que nesta situaçao 

ui (i/fiy = i, 

ou seja, ([/]£)' = ([/1^) _1 , e ainda mais 

(wjy = [/ig 

Isto facilita o processo seguido para se encontrar [lf a conhecendo [7]p 
onde a e /3 são bases ortonormais. [7]^ é nada mais que a transposta de [7]^. 

Estamos agora em condições de introduzir os conceitos de operador ortogonal 
e auto-adjunto. 


9.2 OPERADORES AUTO-ADJUNTOS E ORTOGONAIS 

Agora definiremos os operadores associados às matrizes estudadas em 9.1, esta¬ 
beleceremos relações entre estes e o produto interno e descobriremos as parti¬ 
cularidades de seus autovalores. Isto nos permitirá chegar a importantes resul¬ 
tados sobre diagonalização na próxima secção. 

9.2.1 Definição: Seja V um espaço vetorial com produto interno, a uma 
base ortonormal e T : V V um operador linear. Então 
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a) T é chamado um operador auto-adjunto se [T]^ é uma matriz simé¬ 
trica. 

b) T é chamado um operador ortogonal se [T]^ é uma matriz ortogonal. 

Os operadores auto-adjuntos (ou ortogonais) estão bem definidos no senti¬ 
do de que o fato de um operador ser auto-adjunto (ou ortogonal) não depende 
da base ortonormal escolhida, isto é, se [Tj® for simétrica (ou ortogonal) numa 

determinada base ortonormal a, então [T]^ também será simétrica (ou ortogo¬ 
nal) para qualquer outra base ortonormal j3. Mostremos este fato no caso do 
operador ser auto-adjunto. (0 caso ortogonal é demonstrado de maneira simi¬ 
lar.) 


Sejam a e 0 bases ortonormais e suponhamos que [ T seja simétrica. 
Queremos mostrar que [7ljg também é simétrica, isto é, ([T]^)' = 
Observamos que 

ing = ((/]£)-' • • ui 

Também 

([/]£)-* = (Mj)' 

pois a e j3 são ortonormais (Veja 9.1.5). Então 

mg = ([/£)' • iTf a • ui 

Tomando a transposta temos 

([T§)\(uiy-([Tf a )'-ui 

= (wjy • mj • ui 

= mjj 

pois (\JÍ)" = uf a e [flj é simétrica. 

9.2.2 Exemplos 

Exemplo 1 : Consideremos T: R 3 R 3 , a rotação de um ângulo d em 
torno do eixo-z. Podemos expressar T por: 

1\x, y, z) = (x cos 6 -y sen d, x sen Ô + y cos 6, z). (Verifique.) 
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Figura 9.2.1 

Tomando a base canônica a e calculando a matriz de T nesta base, temos 


m“ = 


cos 8 -sen 0 0 

sen 8 co$ 0 0 

0 0 1 


Já vimos que esta matriz é ortogonal e portanto T é urn operador ortogonal. 

Exemplo 2: Seja T:R 2 -> R 2 onde 7\x, y) = ( 2x - 2y, -2x + 5^). 

Se a é a base canônica de R 2 , a matriz de T è [T]^ = 
triz simétrica, e portanto T é operador auto-adjunto. 

Estudemos agora as propriedades destes operadores. 


uma ma- 


9.2.3 Teorema: Seja V um espaço vetorial com produto interno < , > e 
T :V -+ V linear. Entáo T auto-adjunto implica que <7v, w) = (v, 7w> para todo 
v, w €E V. 


Prova : (caso n = 2) 

Sejam a = (vi, v 2 } uma base ortonormal, v = x x \ x + jqv 2 


w = x 2 V! + y 2 \2 ou [v] Q = 
Como T é auto-adjunto, [T]^ 


hi 

11 

hi 

_jy 1 j 

“ | 

hJ 


é simétrica. 


e 


Seja [71“ 


a h 
b c 
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Então [7v] q 


a b 


*1 


**1 

+ by x 

e [7 wL = 

a b 

X 2 

b c 

1 

Ti 

i— _ 


bx { 

+ O'! 


b c 

_y 2 _ 


ax 2 + by 2 
bx 2 + cy 2 


Assim <7v, w> = (jx! + by x )x 2 + {bx x + cy í )y 2 

e <v, 7w> = Xi(ax 2 + by 2 ) + y\(bx 2 + cy 2 ) e portanto, <7V, w) = <v, 7w>. 


9.2.4 Teorema: Seja T:V^ V auto-adjunto e Xj, X 2 autovalores distintos 
d e íe v, e v 2 os autovetores associados a \ y e X 2 , respectivamente. Então 
Vi 1 v 2 . 

Prova \ 

\i (vi, v 2 > = <Xj v x , v 2 ) = (7v,, v 2 > ~ <v,, T\ 2 ) - 
= <Vi, X 2 v 2 > = X 2 (vj, v 2 > 

Então (Xi - X 2 ) <V!, v 2 ) = 0. 

Como Xi - X 2 ^ 0, vem que <Vi, v 2 ) = 0 ou Vj 1 v 2 . 

As propriedades dadas a seguir são conseqüências dos resultados anteriores mas 
são tão importantes que as destacaremos numa secção especial. 


9.3 DIAGONALIZAÇAO DE OPERADORES AUTO-ADJUNTOS E 
CARACTERIZAÇÃO DOS OPERADORES ORTOGONAIS 

O teorema 9.2.4 nos dá uma idéia de que, com relação à diagonalização, os 
operadores auto-adjuntos comportam-se de uma maneira especial. Por exemplo, 
se T :V ^ V for auto-adjunto, dim V = n e T admitir n autovalores distintos 
(portanto uma base de autovetores), então T é diagonalizável e os autovetores 
são automaticamente dois a dois ortogonais e, após a normalização, podem ser 
transformados em ortonormaís. Isto é, T, além de ser diagonalizável, admite 
uma base ortonormal de autovetores. Tal propriedade continua valendo em ge¬ 
ral e é característica dos operadores auto-adjuntos. Temos assim: 


9.3.1 Teorema: Seja T \VV um operador auto-adjunto. Então existe 
uma base ortonormal de autovetores de T. 

Se você está interessado na demonstração desse teorema, siga cuidadosa¬ 
mente as etapas enunciadas nos Exercícios 10, 11 e 12 da secção 9.4. 
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9.3.2 Exemplos 

Exemplo 1 : Seja T : R 3 -> R 3 o operador linear cuja matriz em relação à 
base canónica é 


[71 


-2 0 0 

0 6 1 

0 1 6 


Podemos exibir uma base ortonormal de autovetores para este operador? Inici¬ 
almente observamos que T é um operador auto-adjunto pois a base canônica é 
ortonormal (em relação ao produto interno canônico) e a matriz é simétrica. O 
teorema 9.3.1 garante, então, a existência de uma base ortonormal de autoveto¬ 
res. Calculando os autovalores e autovetores associados temos; 

Para X, = -2, v, = (1, 0, 0); para X a = 7, v 2 = (0, 1, 1) e para X 3 = 5, 
v 3 = (0, 1, -1). 

Como estes autovetores provêm de autovalores distintos*e T é auto-adjun¬ 
to, o teorema 9.2.4 garante que eles são ortogonais. Então {(1, 0, 0),(0,1,1), 
(0, 1, -1)} é uma base ortogonal de autovetores. Basta agora normalizá-los para 
obtermos a base procurada: 

{(1, 0, 0),^ (0, 1, 1), ^j(0, -!)}• 


Exemplo 2: Seja o operador linear 7: R 3 — R 3 cuja matriz em relação à 
base canônica é 

~2 1 1 

1 2 -1 
_1 _1 2 _ 

Exibamos uma base ortonormal de autovetores para este operador. Procedendo 
de modo análogo ao anterior, vemos que T é auto-adjunto e portanto tal base 
existe. Calculando os autovalores e autovetores associados temos: Para Xi = 0, 
os autovetores são do tipo (-y, y, y) e o subespaço destes autovetores tem di¬ 
mensão 1. Para \ 2 = 3 os autovetores são do tipo (y + z, y, z) e o subespaço 
associado tem dimensão 2. 

Vamos construir uma base de autovetores escolhendo um autovetor do 
subespaço associado a X, = 0 e dois autovetores LI do subespaço associado a 
X 2 - 3. Suponhamos que Vi = (-1, 1, 1) tenha sido tomado no primeiro subes¬ 
paço. Como todos os autovetores no segundo são da forma (y + z, y , z), obser¬ 
vamos que o produto interno de (-1, 1, 1) com qualquer da forma (y + z,y, z) 
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é 0. Mas não é garantido que quaisquer dois vetores de (y + z, y, z) são orto¬ 
gonais, mesmo que sejam LI. Por exemplo, (1, 1, 0) e (1, 0, 1) são LI mas 
não ortogonais. Contudo, podemos usar o vetor (1, 1, 0) e procurar outro ve¬ 
tor do tipo (y + z, y f z) que seja ortogonal a (1, 1,0), isto é, o produto in¬ 
terno destes deve ser nulo. Ou seja, 

>' + z+ _y = 2>'+z=0 ou z = -2y 

Um vetor que satisfaça estas relações deve ser do tipo (-y y -2 y). Por exem¬ 
plo (-1, 1, -2). 

Ficamos assim com a base {(-1, 1, 1), (1, 1, 0), (-1, 1, -2)} que é for¬ 
mada de autovetores dois a dois ortogonais. Normalizando estes vetores temos 
a base procurada: 

{ ^h (_1 * u l ’ °>>7ó u " 2)} 


Suponhamos que a seja uma base ortonormal qualquer de V e 0 a base 
ortonormal de autovetores dada pelo teorema 9.3.1. Observemos a relação entre 

[r]« e mg. Temos [r]“ = [/]£ * [tf . [/]“ = ([/]“)"* . [ T f • [if e portanto. 


= ([/]“>' • [7*ig • [/]" pois a e p são ortonormais. Isto será utilizado na 
classificação das cônicas. 

O teorema seguinte caracteriza as transformações ortogonais. 


9.3.3 Teorema: Seja T: V -► V um operador linear num espaço vetorial V 
com produto interno (, ). Então as condições abaixo são equivalentes: 

a) T é ortogonal. 

b) T transforma bases ortonormais em bases ortonormais. Isto é, se 
{vj, ..., v„} é base ortonormal de V, então {7V lf Tv„ } é uma base orto¬ 
normal. 

c) T preserva o produto interno, isto é, < Tu , 7» = <u, v>. 

d) T preserva a norma, isto é, II 7v II = II v IL 


Prova: A demonstração é deixada como exercício. 

O item (d) dá uma caracterização geométrica dos operadores ortogonais. 
Estes são, entre os operadores lineares, os que estão associados a movimentos 
rígidos. Por exemplo, se nos restringirmos às transformações lineares do plano 
no plano, estes operadores serão as rotações de um ângulo 6 e as reflexões em 
relação a uma reta pela origem, ou composições delas. 
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9.4 EXERCÍCIOS 

1. Seja a = (wi, w 2 , w 3 } uma base de V , um espaço vetorial real com pro¬ 
duto interno (, ). 



Se (u, v> = 2, a base a é ortonormal? 


2. Ache valores para x e y tais que 



seja uma matriz ortogonal. 


3. Sejam a = {(1, 1), (2, 0)} e 0 = {(-1, 0), (2, 1)}. A partir das bases a e 
0 construa bases ortonormais, usando o método de Gram-Schmidt. Se estas 
novas bases forem a e ff respectivamente, mostre que a matriz de mudança 

t 

de base [/]£ é ortogonal. 


4. Dada uma matriz A cujas colunas sao vetores ortonormais, prove que A é 
ortogonal. 


5, Seja T(x, y, z) = (2* + y, x + y + z, y - 3z) de R 3 em R 3 com produto 
interno canônico. 

a) Mostre que T è um operador auto-adjunto mas não ortogonal. 

b) Se v = (2, -1, 5) e w = (3, 0, 1), verifique que <7v, w> = <v, 7w>. 

c) Exiba uma base de autovetores de í e verifique que é uma base ortogo¬ 
nal. A partir desta base, escreva uma base ortonormal. 


’a 0 0 

6. Dada a matriz A - 0 b c 

0 c b 

a) Mostre que os autovalores são: a, b + c e b - c, 

b) Ache uma base de autovetores. 

7. Seja o operador linear T R 3 ~*R 3 cuja matriz em relação à base canônica é 



Exiba uma base ortonormal de autovetores. 
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8. Mostre que uma transformação ortogonal do plano no plano deixa invariante 
a distância entre dois pontos, isto é, dados u e v vetores quaisquer do pia- 
no, 

mu) - 7Tv)l = lu - V» 

(Sugestão: use o teorema 9.3.3 (d).) 

9. a) Mostre que se T é uma transformação ortogonal do plano no plano, sua 
matriz em relação à base canônica só pode ser da forma: 

cos a -sen a~| 

sen a cos aj 

ou da forma 

cos a sen a 

sen a -cos a 

(Sugestão: 9.3.3 (tf).) 

b) Observe que se a matriz de T for da forma dada por A. T será uma ro¬ 
tação de um ângulo a (veja 5.2,4.). Mostre que B = A • J onde J = 

j « (J é a matriz em relação à base canônica de reflexão no 

eixo-x. Veja 5.2.2. Conclua finalmente, usando composição de funções, 

que se a transformação T for dada por B, T será uma reflexão através de 
uma reta do plano que passa pela origem. 

10. Sejam V um espaço vetorial real de dimensão «, com produto interno <, ) e 
T:V^ V um operador linear auto-adjunto. Se a for uma base ortonormal 
de K, chamemos de A a matriz Consideremos a transformação linear 

:Ç n -+ C n dada por 

T a ; 

x n 

onde Xj €. C (C = conjunto dos números complexos) e o produto interno 
canônico em C”, dado por 

<v, w> c = x l y l + x 2 y 2 + ... + x n y n 
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e w = : (Veja 8.6.) 

yn 

a) Mostre que T A tem sempre autovalores. (Sugestão: Lembre-se de que um 
polinómio sempre tem raízes se estivermos trabalhando sobre os números 
complexos.) 

b) Mostre que <r A v, w> c = <v, r A w> c para quaisquer v, w € C n . (Sugestão: 
Siga a idéia do teorema 9.2.3.) 

c) Mostre que os autovalores de T A são necessariamente reais. (Sugestão: 
Chame de X um autovalor de T A com autovetor v. Lembre que para um 
número complexo X ser real, basta que ele seja igual ao seu conjugado. 
Desenvolva então <r A v, v> c de dois modos distintos, utilizando o item ( b ) 
e as propriedades de produto interno sobre um espaço vetorial complexo. 
Veja 8.6.) 

d) Mostre que os autovalores de T e T A são os mesmos. 

e) Utilizando os resultados anteriores, conclua que um operador linear auto- 
-adjunto tem autovalores e eles são necessariamente reais. 

11. Seja V um espaço vetorial real de dimensão w, T:V-> V um operador linear 
auto-adjunto e v E V um autovetor de T. 

a) Mostre que [v], o espaço gerado por v, é invariante por aplicação do ope¬ 
rador 7\ isto é, se w € [v], então 7w € [v]. 

b) Mostre que [v]-L, o complemento ortogonal de [v] (veja 8.5), é invariante 
por aplicação do operador T , isto é, se w 6 [v]"* - , então 7w E [v]^ e por¬ 
tanto T induz um operador linear T\ :[v]^-» [v]^ 

w 7w 

c) Mostre que o operador T x definido no item (/>) é auto-adjunto. 

d) Mostre que todo autovetor w de Tj com autovalor 5 também é autove¬ 
tor de T com o mesmo autovalor 6. 

12. Demonstre o teorema 9.3.1, isto é, se T:V-> V um operador linear auto-ad¬ 
junto, então existe uma base ortonormal de autovetores de T. (Sugestão: 
Faça por indução finita sobre a dimensão de F, utilizando os Exercícios 10 
e 11.) 

13. a) Dê a transformação linear que descreve o movimento rígido que leva o 

segmento de extremos (-6, 2) e (-1, 2) no segmento de extremos (-2, 6) 
e (1, 2) respectiva mente. 

b) Mostre que esta transformação é uma rotação e encontre seu ângulo. 

14. a) Use a definição 9.2.1 e o teorema 9.3.1 para mostrar que um operador é 

auto-adjunto se e somente se existir uma base de vetores ortonormais 
em relação à qual \T é diagonal. 
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b) Use agora o resultado acima para dar uma caracterização geométrica das 

transformações auto-adjuntas do plano no plano. (Observe que * = 

e note o efeito geométrico de cada uma destas 

duas últimas matrizes. 

c) Analise separadamente em k) os casos 

0 a j= 0 e b 0. 

//) a = 0 e b # 0. 

iii) a - 0 e b = 0. 

d) Seja a a base canônica e [7]^ = 

í) Diagonalize o operador T. (Escolha uma base ortonormal.) 

ii) Interprete geometricamente T usando b ). 

iii) Teste sua interpretação geométrica, verificando qual é a imagem por 
T de um quadrado de vértices (0, 0), (1, 1), (0, 2) e (-1, 1). 



a 0l I" 1 0 
o ij * L° b 


9.4.1 Respostas 

1. Não, pois < u, v > =£ 2 • 5 + (-1) • 2 + 3 (-3). 
= -1 


3. a' = {( 

1 1 

v/2’ v/2 

( v/r 


' 1 

1 

t 

r .Q' 

'v/T 

" n 

= 

1 

1 


_ /I 

' n 

5. [71 = " 

2 1 

0 " 


1 1 

1 


0 1 

-3 . 


fi' = {(- 1 , 0 ), ( 0 , 1 )} 


wj -(i/Çy-/ 


de [ T ] não são vetores ortonormais, T não é ortogonal. 

7. X, = -9, X 2 = X 3 = 3 

v, = (1, -2, -1), v 2 = (1, 0, 1), v 3 = (1, 1, -1) 

„ ,, 1 -2 -1 1 . 1 . . 1 1 -i , 

P ~ JT ’ /6 ’ /6 h ( li ’ °’ J2 K /T ’ v/T ’ /T )} 

9. a ) Sejam T = ^ ^ j e v = (x, y) qualquer T ortogonal => 117~ ( v , I 
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= ||v|| etc., escolhendo vários vetores v para gerar um sistema de equações 
que fornece a f b , c e d. 

b) Sugestão: a inclinação da reta pela origem tem inclinação de ^ . Ach 
imagem do ponto (x. y), onde v = (x, y), c mostre que esta imagem é 


exatamente B 


ou seja, T v 


11. a) w € lv]3« € R tal que w = uv. 

rw = T(uv) = uTv = u ■ Xv onde X é o autovalor associado a v. Mas 

(nX)v £ [v], e portanto Tw £ [v]. 

b) Seja w £ [vj 1 . Então < w, v > = 0. 

Como < i w, v > = < w, Tv > pois T i auto-adjunto, e 

Tv = Xv, < Tw, v > = < w, Xv > = X < w, v > = 0 

Portanto, Tw £ [v]^. 

c) Seja 0 = {^ii , v 2f v„} uma base ortonormal de V. 

Então fo = {v 2 .v„ } é uma base de [v] 1 . 

[r] é simétrica pois T é auto-adjunto e da iorma T m 0 - 


Então [7\]^ = 


d 71 

<*2 n 

a m 

a nn 


a\í 

0 

0 

0 

<*22 

a 2 n 

0 

a n2 

•* <*nn 


é simétrica e Ti é auto-adjunto. 


d) Tw = Ti*/, pois w £ [v] 1 , e T i w ~ 5w - 

Então 6 é autovalor de T e w um autovetor associado. 


13. Seja [T] = 


. Então 


a b -1 


^ = I \ I . Logo, [r] 


onde a = - arccos — 


’ 3 

±1 


5 

5 


-4 

3 


„ 5 

5 . 



cos a - sen a 
sen a cos a 
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FORMAS LINEARES, 
BILINEARES E QUADRÁTICAS 


10.1 FORMAS LINEARES 

I 

Suponha que uma pessoa necessite comprar ferro, chumbo e cobre a cinco, seis 
e quatro cruzeiros o quilo, respectivamente. Se esta pessoa compra x quilos de 
ferro, y quilos de chumbo e z quilos de cobre, podemos representar esta com¬ 
pra pelo vetor (x, y, z) e o custo total é dado pela expressão 5x + 6y + Az. 
Observe que a “função custo” 

c : R 3 -> R 

(x, y, z ) i—» 5 jc + 6y + 4z 

é uma transformação linear (verifique) cujo contra-domínio é um espaço vetorial 
muito particular, pois é o conjunto dos números reais. Transformações lineares 
deste tipo aparecem muito e por isso recebem um nome especial. 

10.1.1 Definição: Seja V um espaço vetorial real. Uma forma linear é 
uma transformação linear /: V -► R 
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10.1.2 Exemplos 

Exemplo 1 : /: R 2 -» R 

(x, y) i-> x + y ou na forma matricial 

■> [;] 

Exemplo 2: g : R 3 —* R 

(x, ^ z ),—y 2x + y - 2 ou na forma matricial 


' X 1 

y 

►-* [2 1 -1] 

‘ X 

y 

z __ 


. * . 


Se /: V -* R é uma forma linear, a = {vj, .., v^} é base de K e (3 

= {w} é base de R, então 

[/]p = [^i ^2 — a n ] lXn . 

Se v € K é tal que 


r 


*1 


[v] 


a 


Xn » 


então [/(v)^ = [/]“[v] a . 


10.2 FORMAS BILINEARES 

Consideremos agora funções, associadas a espaços vetoriais, que se comportam 
mais ou menos como produtos internos, isto é, funções que a cada par de ve¬ 
tores associam um número de tal forma que uma vez fixado o primeiro vetor, 
a função seja uma forma linear em relação ao segundo vetor, e vice-versa. Fun¬ 
ções deste tipo estão muito relacionadas com considerações acerca da energia 
de um corpo (veja 10.5) e, portanto, com toda a Física. Nesta secção definire¬ 
mos estas funções, que serão denominadas formas bilineares, e estudaremos al¬ 
guns aspectos técnicos, principalmente o seu relacionamento com matrizes, que 
é o mais importante na prática. 
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10.2.1 Definição: Seja V um espaço vetorial real. Uma forma bilinear é 
uma aplicação B : V X V -> R definida por (v, w) i— > B(v, w) tal que: 

0 Para todo w fixado, B(\, w) é uma forma linear em v, isto é, 

B(v i + v 2 , w) x £( Vl , w) + B(v 2 , w) 
e B(a\ , w) = aB(\, w) 

li) Para todo v fixado, B(v , w) é uma forma linear em w, isto é, 

£(v, Wi + w 2 ) = £( v , wO + i ?(v, w 2 ) 
e B(\, aw) = aB{\ y w) 


10.2.2 Exemplos 

Exemplo 1 : O produto usual de números reais 

p:RX R -► R 
(*> y) p(x, y) = xy 

Verificando í) e //): 

p(x, y + 2 ) = x(y + z) = xy + xz = p(x, >-) + p(x, z) 

p(ax, y) = ax • y = a(xy) = ap(x, j) 

Analogamente mostram-se as outras propriedades. 

Exemplo 2: B : R 2 X R 2 -► R dada por 

(x 2 ,y 2 )) = X^x 2 - 2y t y 2 

é bilinear. De fato, 

B (( x i, ^i), (x 2 , y 2 ) + (x 3 , Jfs)) = B((xi, J-i), (*2 + * 3 , y 2 + ^3)) = 

= *i (*2 + *3) + 2y,0 2 + y 3 ) = (* 1*2 + + *iX 3 + 2y t y 3 = 

= £((* 1 » yi), (xj, y 2 )) + B((x 1 , yi ), (x 3 . y 3 )) 

As outras propriedades são verificadas de modo análogo. 


Exemplo 3: Seja V um espaço vetorial com produto interno <,>. Podemos 
definir a forma bilinear V X V -► R por B(v, w) = <v, w>. O fato de B ser 
bilinear é uma conseqüência das propriedades de produto interno. 

Vamos considerar agora um exemplo importante. 


Exemplo 4 : 


Seja M = 


'-2 

4 

0 


0 0 
2 0 
0 2 
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Podemos associar a M uma forma bilinear B : R 3 X R 3 -*■ R deiinida por 


'-2 

0 

0‘ 

~y i" 

B((xt, x 2 , x 3 ), (yi,y 2 ,y3)) = [*i *2 * 3 ] 4 

2 

0 

y 2 

_ 0 

0 

2 

%y*. 


= -2*1^1 + 4X2^1 + 2x 2 ^2 + 2X3^3 

A bilinearidade de B decorre das propriedades do produto e da soma de matri¬ 
zes. 

Exemplo 5: Sejam V um espaço vetorial de dimensão n e a uma base de 
V. De modo análogo ao que foi feito no exemplo anterior, dada uma matriz 
qualquer M„x/n podemos associar uma forma bilinear B:V X V R de ini- 
da por: 

xii >r 

: e [w] a = | 

*n .y* 1 . 

S e B :V X V R é uma forma bilinear e dados , v 2 , w x , w 2 em K, 
em geral temos 

B(v 1 + v 2 , w 2 + w 2 ) * B(y ly w L ) + B(v 2 , w 2 ) 

pois £(V! + v 2 , w 2 + w 2 ) = fi(v l5 W! + w 2 ) + S(\ 2 2 Wi + w 2 ) = 

= B(y l9 wO + B(y u w 2 ) + B(y 2 , w t ) + £(v 2 , w 2 ) 

B(v, w) = [v]^ M [w] a 

Observe» ainda, que no Exemplo 4, temos V = R 3 e a base canônica. A 
seguir veremos que, na verdade, toda forma bilinear pode ser escrita na forma 
do Exemplo 5, dado acima. 

10.3 MATRIZ DE UMA FORMA BILINEAR 

Sejam V um espaço vetorial e B : V X V -+ R uma forma^bilinear. Dada uma 
base a = {vj, ..., v tt } de V, associamos a B uma matriz [/?]^ chamada matriz 

da forma bilinear B y na base a, do seguinte modo: 

Se v = x l \ l + ... + x n \ n e w - + ... + y n Vn> n 

B(\ , w) = B(x 1 \ l + ... + x n \ n , yiV L + ... + v/) 
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£( v i, vj... fl( Vl) v„)' r 

= [*1 - *nl : : 

_Biy n , Vj) ... B(y n , v„) y n 

- 

10.3.1 Exemplos 

Exemplo 1 : Seja 5:R 2 X R 2 -^Ra forma bilinear dada por £(v, w) = 
- -x i y l + 2* 2 >q + 5x 2 y 2 onde v = (r h x 2 )ew = Oi, y 2 ). Então se 
a = (e,, e 2 } é a base canônica de R 2 , temos 

rni** _ B(ci . ei) Í?(ei, e 2 ) _ -1 0 

a [l?(e 2l e x ) 5(e 2 , e 2 ) J ~ [ 2 5 

Com isto, podemos escrever a forma bilinear dada na forma matricial: 

B(y, w) = [x, x 2 ] [ l °.]\ y ' 

1 J L *^ 2 

ou seja, B(y, w) = [v]' a [B]% [w] a 

Exemplo 2: Seja i:R 3 X R 3 -> R a forma bilinear definida por 
B((xi, x 2 , x 3 ), (yi,y 2 ,y 3 )) = -2x^, + 4x2.Pi + 2x 2 ^ 2 + 2x 3 >> 3 . Procure¬ 
mos [jS]^ , onde a = {ej, e 2 , e 3 }, é base canônica de R 3 : 

B(e ,, e,) B(e,,e 2 ) B(e,,e 3 ) 

[Bl“= B(e 2 , e,) B(e 2 , e 2 ) B(e 2 , e 3 ) 

J?(e 3 , e,) £(e 3 ,e 2 ) B(e 3 , e 3 ) 

Nesta matriz determinamos, por exemplo, #(e 2 , = Z?((0, 1 0), (1, 0, 0)) = 

= '2*0* 1+4* 1 • 1+2* 1 • 0 + 2 • 0 • 0 = 4. Calculando os outros 
elementos, obtemos 

-2 0 0 

[B}<*= 4 2 0 

[o 0 2 


Compare com o Exemplo 4 de 10.2.2. Como não poderia deixar de ser, 
[*]£ = M. 
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10.4 FORMA BILINEAR SIMÉTRICA 

10.4.1 Definição: A forma bilinear B : V X V —* R é simétrico se 
B(v, w) = B( w, v) para todo v, w £ V. 

10.4.2 Exemplos 

Exemplo 1. Seja (,> um produto interno em V. Então a forma bilinear 
Z?(v, w) = <v, w> é simétrica, pois <v, w) = <w, v). 

Exemplo 2: B: R 1 X R 1 -*• R dada por 

5(v, w) = -x t y\ + 3 x^yi + 3xiy z + 2x 2 y 2 
onde v = (x u x 2 ) e w = 

Calculando, B( w, v), temos 

B{ w, v) = (Oi,^í), (*i> * 2 )) 

= -^í^i + 3)>2Xi + 3y 2 x , + 2y 2 x 2 

Como B(v, w) = fl(w, v), B é simétrica. 

Observe que [B\® é uma matriz simétrica. De fato: 

_1 3 _y, 

B(v, w) = [xi x 2 ] • 3 2 ' y 2 

Este resultado vale em geral, podendo ser enunciado no teorema abaixo. 

10.4.3 Teorema: Uma forma bilinear B.VX V —» R é simétrica se e 
somente se [£]“ é uma matriz simétrica. 

Prova: (Veja o Exercício 7 de 10.7.) 

10.5 FORMAS QUADRÁTICAS 

Consideremos uma partícula de massa m deslocando-se no espaço com veloci¬ 
dade v = (v*, v v , v z ). A energia cinética que esse corpo possui é dada pela 
expressão 



Portanto, 
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E c 


m 

2 


2 , m 
Vx 2 



v 


2 

1 


ml 2 0 0 v x 

= [v* v y v z ] 0 ml 2 0 v y 

0 0 m/2 v z 

Dessa forma, a energia cinética pode ser interpretada como uma função (que 
não é linear) da velocidade. 



Figura 10.5.1 

E c :R 3 -> R 

. . m 2 , m 2 , m 2 

(y x , Vy, V z ) I *■— . V* +y • Vy +Y • V z 

Se considerarmos, agora, a aplicação bilinear simétrica 

B : R 3 X R 3 -»■ R 

cuja expressão é 

m/2 0 0 w x 

B((v x , Vy, v z ), (w x , Wy, w z )) = [v x VyV 2 ] 0 ml 2 0 w y 

0 0 m/2 w 2 , 

observamos que 

E c {v x , Vy, v z ) = B((v x , Vy, v z ), (v*, Vy, v z )). 

Expressões que se comportam como a da energia cinética, isto é, que pro¬ 
vêm de formas bilineares simétricas, recebem o nome de formas quadráticas . 

Agora, poderemos formalizar este conceito. 

10.5.1 Definição: Seja V um espaço vetorial real e B : V X V -> R uma 
forma bilinear simétrica. A função Q : V -+ R definida por Q(v) = B(\ , v) é 
chamada forma quadrática associada a B . 

Biblioteca de Ca¬ 
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Observe que (de 10.4.2) em relaçao a uma base a de V, Q pode ser ex¬ 
pressa na seguinte forma: 

e(v) = [v] a [5]« lv] a 

onde [B I a é uma matriz simétrica. 

10.5.2 Exemplos 

Exemplo 1 : 

Q : R 2 -+ R 

Q{\) = x 2 - IOjcjv + y 2 , onde v - (x, y) 

Sabemos que 

«*> - I* >-1 [í c] [í 

= ax 2 + 2 bxy + cy 2 . 

Então, ax 2 + 2 bxy + cy 2 = x 2 - lOxy + y 2 . 

Logo, a = 1,2 b = -10, c = 1 
Substituindo, 

ÔM-M [J 1] [j 

Observe ainda que Q é a forma quadrática associada à forma bilinear: 

B(v, w) = [*! yi) J J 

onde K = y\ ’ t wl a = yl e [ K = _5 5 

(a é a base canônica de R 2 .) 

O procedimento adotado no exemplo anterior pode ser aplicado a uma 
forma quadrática genérica Q : R 2 R, onde Q(x, y) - Ax 2 + Bxy + Çy 2 . 
Concluímos então que sua forma matricial é 

'<• f 

Q(x, y) = [x y] • 

ã r 

2 C 

im 
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Exemplo 2: 

Q : R 3 -> R 

£(*, y, z) = 3x 2 + 2ry + 4y 2 + 5 yz. 

Em relação à base canônica de R 3 , Q é dada na seguinte forma matricial: 

3 

Q(x f y, z) = [x y z] 1 
0 

Compare com o exemplo anterior e extraia um resultado análogo para formas 
quadráticas Q : R 3 -> R, 

Q(x t y, z) - Ax 2 + By 2 + Cz 2 + Dxy + Eyz + Fxz . 

Exemplo 3\ 

Q : R 3 - R 

2(x, >>, z) = 2x 2 + y 2 - 3z 2 

'2 0 o] r x" 

= [x y z] 0 1 0 y 

0 0 -3 _z_ 



10.6 DIAGONALIZAÇAO DA FORMA QUADRÁTICA 

Veremos a seguir que qualquer que seja a forma quadrática Q : V -> R sempre 
existe uma base ortonormal de V em relação a qual a matriz de Q é diagonal, 
ou seja, Q terá uma forma parecida com a do Exemplo 3 de 10,5.2. Antes de 
formalizar este resultado no teorema 10.6.1, vamos diagonalizar a forma qua¬ 
drática do Exemplo 1 de 10.5.2. fi(v) = - 10 ^ + / onde v = (*> J* Prü ‘ 

curemos uma base 0 de modo que se 



<2(v) = \ix] + 




ou ainda 


ô(v) = [*1 
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Temos 

i _ 5 i r ] 

Q(x, y) = [* >>] _ 5 j 

ou Q(x, y) = [v]; [7?]“ [v] a , a base canônica do R 2 . Como a matriz [5]“ é 

simétrica, ela é diagonalizável, admitindo um conjunto de autovetores ortonor¬ 
mais. 

Os autovalores de [B]^ são Xj = 6 e À 2 = -4. Procurando os autovetores, 
encontramos para = 6, v x - (x, - x ) e para X 2 =.-4, v 2 = (x, x). 

(Verifique.) Assim, uma base ortonormal 0 de autovetores será dada por 

1 1 1 JU 

v ' = ( V2 ’ ~y/2 } e Vl ‘ ( \/2 ’ V2 ' 

Seja [7]^ a matriz de mudança de base. Então 

Substituindo em Q(\) = [v]^ [B [v] Q , temos 

ei») - Mi mf [flif m„ 

Como [7]^ é ortogonal, pois a e 0 são bases ortonormais, (veja 9.1.5), 

(wj)- 1 = i/Ç = ([/$' 

donde 

ô(v) = ([/]“[v] tt )'[B]^([/]“ [vy 

= Mj, m* Hp. 

Isto é, 
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10.6.1 Teorema: Seja Q(\) - B(y , v) uma forma quadrática em V . Existe 
uma base ortonormal 0 de V tal que se 


Pi 

[vlp= 

y n 


entáo Ô(v) = + .. . + \,y 2 „. 

Prova : Seja a uma base ortonormal qualquer de V. 

Então Q(v) = B(y, v) = fv]' a (7?]“ [v] a . Logo, a matriz [*]« é uma matriz si¬ 
métrica e, portanto, corresponde a um operador auto-adjunto T:V -+ V que 
tem como matriz = [2?]^ • Como um operador auto-adjunto pode ser dia- 
gonalizado mediante uma base 0 de autovetores ortonormais, então 

X, 0' 

[< = = i/jS [/ ç 

o X„ 



'x, o' 

= (UÇ wjf 

0 X/j j 


pois a e 0 são bases ortonormais e, portanto, [7]^ é uma matriz ortogonal. 
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Então, 

Xi 0" 

QCv) - [vl^ . 

0 x„ 

x, o' 

= «/]jj W«y ' • (W? I V U 

L° v 




= X,^J + X^ + • • • + XnJn- 

10.6.2 Exemplos 

Exemplo 1\ Seja a forma quadrática em R 2 dada por: 

Se v=(x 1 ,jr 2 ), 

Q(v) = -Ax\ - 6x t x 2 + 6x 2 

= -4.x 2 - 3X\X 2 ~ 3xjX2 ^ 6jc 2 

r i r ~ 4 _3 i r*. 

“ tjc ‘ Xal [-3 ój [* 2 

Calculemos os autovalores. 

P(X) = det X 6 = X 2 - 2X - 33 

X, = 1 - >/34 e X 3 = 1 + >/34 


Então existe uma base 0 (que é aquela de autovetores da matriz) tal que se 


Formas Lineares, Bilineares e Quadráticas 281 


‘l -s/34 0 

então Ô(v) = bi .P*] 

0 1 +\^34 

isto é, 

Ô(v) = (1 - \^34 ).y 2 + (1 + v^34 )y\ 

Esta diagonalização das formas quadráticas (forma normal) tem muitas 
aplicações e uma delas será vista na classificação das cônicas, que apresentare¬ 
mos no próximo capitulo. 

10.7 EXERCÍCIOS 

1. Seja / uma forma linear de R 2 em R tal que 

f(x, y) = -x + 2 y 

Sejam a = {(1, -1), (2, 0)} e jj = {-l} bases de R 2 e R respectivamente. Se 
M a = j , calcule |/(v)]^. 

2. Verifique se as aplicações abaixo são formas bilineares. 

a) B.R 2 X R 2 -»■ R definida por £((*,, y t ), (x 2 , y 2 )) = x t + y 2 

b) B : V X V -► R definida por £(u, v) = <u, v>. 

3. Em 2b) você deve ter mostrado que todo produto interno é uma forma bi¬ 
linear A recíproca é verdadeira? 

r_i 2 I 

4. Se M = ^ ache a forma bilinear B : R 2 X R 2 -► R associada à 

matriz M. Esta forma bilinear é simétrica? 

5. Qual é a matriz M 2X 2 associada à forma bilinear de R 2 X R 2 -* R que 
dá o produto interno usual de R 2 ? 

6. a) Seja A : R 3 X R 3 -► R definida por A((x , y , z), (x\y\ z')) = xy r + 

+ xz - yx - zy + zz , Ache a matriz de A em relação às bases í) canô- 
nica ii ) {(1, 1, 1), (1, 1, 0), (0, 1, 0)}. 
b) Seja A : R 2 X R 2 -»■ R definida por A((x, y), (x', y')) = xy - yx' e 
a = {(1, 1), (-1, 1)}. Ache [A]%. 
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7. Mostre o resultado afirmado em 10.4.2 e use este fato para dar exemplos de 
formas bilineares simétricas Í:R S X R s -*• R. 

8. a) Seja /J((x, >>), (x\ y')) = 3xx' - yy . Ache a forma quadrática 

GR 2 ->• R associada a A . 

b) Seja Q{ jc, y) = 2x 2 + 4 xy - y 2 . Ache a matriz da forma bilinear associa¬ 
da. 

9. Seja Q( jc, y) = x 2 + \2xy - 4 y 2 . Determine uma base 0 tal que 

e Q(v) = zx] + bvj 

10. Se A é uma forma bilinear simétrica ega forma quadrática associada a ela, 
mostre que 

A(y, w)=^2(v + w)-^ Q(y - w) 

11. Uma forma quadrática Q é chamada positiva definida , se para todo 
v # 0, Q(y) > 0. 

a ) Como devem ser os autovalores da matriz de uma forma quadrática posi¬ 
tiva definida? (Pense na matriz diagonalizada.) 

b) A forma quadrática Q : R 2 - > R dada pela matriz (em relação à base 

canônica) 

’l 2 
2 - 4 _ 

é positiva definida ? 

12. Mostre que se B(v, w) é uma forma bilinear simétrica cuja forma quadrática 
associada é positiva definida, então B(y , w) é um produto interno. Compare 
com o Exercício 3. 



13. Considere o conjunto V*, formado por todas as formas lineares T: V -► R, 
onde V é um espaço vetorial de dimensão n, e V* é chamado de espaço dual 
de V. 

a ) Mostre que V * é um espaço vetorial. 

b ) Mostre que, dada uma base Vj, ..., v n de V x as formas 7/ : V -+ R de¬ 
finidas por T({vj) = 0, se i ^ / e Tj(vj) = l, se i = j, formam uma base 
de V*. 

c) Conclua finalmente que V e V* são espaços vetoriais isomorfos. 
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10.7.1 Respostas 

1 [f(v)]^ = [1] 


3. Nao, pois /?(u, v) # ü(v, u) e o produto interno é comutativo, ou seja, 
<u, v> = <v, u). 



0 

1 


7. Seja simétrica. = 

Seja u = [*,, ..jc„] 
v =b>i , • ,3'n] 


a n • ■ * n 
a n l ■ • * Qnn 

~ 


onde Qjj — Qjf 


n n 

Então B(u, v) - ii aipo?! 

7 = 1 i= 1 


n n 

e B{v, u) = 11 aijyçcp Como a adição é comutativa e a# = a^, temos, 
7*1 /* 1 

depois de trocar os índices i e /, 
jn n 

B ( v . “) = E Z a ii x ú>i = ■%. v ) a 
/=1 »=1 

Agora, seja B simétrica. Então B{u, i>) = B(v , u ) 
n n n n 

Daí obtemos Z Z = Z Z 

/■» í=i /=i i 

Invocando índices à direita, temos 
n n n n 

Z Z W/ ~ ^ a ji x iyj 

}-1 í=i /=i i=i 

Como isto é válido para todos os vetores w e v, 

= úf /7 e [5]^ é simétrica. 
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Exemplo : Seja 

"o i o o -r 

1 0 2 0 0 

[B] = 0 2-1 0 0 

0 0 0 0 0 

-1 0 0 0 3 

B(u, v) = *i y 2 - + + 2x2^3 + 2x 3 y 2 - x 3 y 3 - x s y t + 3x s y 


9 0= {(vTJ ’ Jn)’ 

e £>(v) = -8;c* + 5 y\ 


3 2 ' 

V r l3 ’ V7T 


. Então [v]p 



11. íz) Os autovalores são todos nao negativos. 


b) Nao, pois os autovalores são 


-3 ± \/41 
2 
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CLASSIFICAÇÃO DE 
CÔNICAS E QUÁDRICAS 


11.1 INTRODUÇÃO 

Neste capítulo estaremos interessados em figuras do plano R 2 ou do espaço 
R 3 , isto é, em conjuntos de pontos no plano ou no espaço, cujas coordenadas 
satisfazem certas propriedades. Por exemplo, o subconjunto 

{(*, y) G R 2 : x + y = 1} 

pode ser representado graficamente, como mostra a Figura 11.1.1, 

1 } 



Figura 11.1.1 
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Outro exemplo é {(x, y t z) E R 3 : x - 2 e y - 1 } cuja representação 
gráfica é 



Figura 11.1.2 


Estaremos particularmente interessados em estudar subconjuntos de R 2 da for¬ 
ma 

5 - {(x, y) E R 2 :F í (x t y ) = 0, .... F k (x, y) = 0} 

e subconjuntos de R 3 da forma 

S = {(x, y, z) € R 3 .F^x, y, z ) = 0, F k (x f y, z) = 0} 

As equações F\(x, y) = 0, ..., F k (x , y) = 0 (ou F x (x, y, z) = 0, ..., 

F k (x, y, z) = 0 no caso do espaço R 3 ) são chamadas equações cartesianas da 
figura que o conjunto determina. Observe que estas equações relacionam as 
coordenadas canônicas, isto é, coordenadas em relação à base canônica de R 2 
(ou R 3 ). Freqüentemente, dá-se apenas as equações cartesianas da figura. 

11.1.1 Exemplos 

Exemplo 1 : Podemos desenhar a figura no plano cuja equação cartesiana 
(em relação à base canônica) é y - x 2 =0. 

A figura pedida é o subconjunto S = {(x, y) € R 2 :y - x 2 =0), consti¬ 
tuído pelos pontos do piano, da forma (x, x 2 ). Portanto, 



Figura 11.1.3 
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Exemplo 2: Para desenhar a figura no espaço cuja equação cartesiana é 
y - x 2 =0, devemos saber que a figura pedida é o subconjunto 
S = {(x, y t z) eR 3 7 = x 2 }. Note que z pode assumir qualquer valor. 



Figura 11.1.4 

Observe ainda que as equações cartesianas dos dois exemplos anteriores são 
aparentemente as mesmas. 

Analisemos agora o que acontece quando as equações cartesianas são de 
tipos especiais. Comecemos com o tipo mais simples, ou seja, as equações 
y) = 0 (ou Hx, y , z) = 0), de primeiro grau. 

11.2 RETAS NO PLANO 

11.2.1 Definição: Uma reta no plano é o conjunto dos pontos (x, y) do 
plano cujas coordenadas em relação á base canônica satisfazem a equação car¬ 
tesiana 

Ax 4* By = C 

onde A =£ 0 ou B =£ 0. Temos as seguintes possibilidades: 



Figura 11.2.2 
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iii) A ^ 0 e B = 0 
Ax - C 


Figura 11.2.3 


{C/A, 0) 


11.3 PLANOS NO ESPAÇO 

11.3.1 Definição: Um plano no espaço é o conjunto dos pontos (x, y, z) 
do espaço cujas coordenadas em relação à base canônica satisfazem à equação 

Ax + By + Cz+D = Q 
onde A ^ 0 ou B ^ 0 ou C =£ 0. 

É claro que esta definição algébrica deve coincidir com a definição geo¬ 
métrica de plano. Consideremos um ponto qualquer (x 0 , y 0 , z 0 ) tal que 
Ax 0 + By 0 + Cz 0 + D ~ 0 (sempre exista). Então a equação Ax + By + Cz + 
+ D = 0 pode ser escrita, subtraindo-se a primeira da segunda, 

0 = A (x - x Q ) + B(y - y 0 ) + C(z - z 0 ) 

= ((A, B , Ç), (x - x 0 , y - y 0 , z - z 0 )> 

onde (, ) representa o produto interno canônico em R 3 . Os pontos (x, y, z) 
que satisfazem a equação são (x, y, z), de tal modo que o vetor diferença 
v = (x - x 0 , y - y 0 , z - z 0 ) seja ortogonal ao vetor (A, B f C). (Veja a Figura 
11.3.1.) Isto corresponde á definição geométrica de um plano que passa pelo 
ponto (x 0 , y 0 , z 0 ) e tem (A, B, C) como vetor normal. 



Passemos agora a analisar o que acontece quando a equação cartesiana é 
de segundo grau. 
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11.4 CÔNICAS NO PLANO 

Para tratar das cônicas no plano de forma adequada procederemos estudando 
figuras padrão e, através da diagonalização de formas quadráticas associadas, 
mostraremos que as equações representam uma das figuras padrão centrada, 
possivelmente, em outro referencial. 

11.4.1 Definição: Uma cônica em R 2 é um conjunto de pontos cujas 
coordenadas em relação à base canônica satisfazem a equação: 

Ax 2 + Bxy + Cy 2 + Dx + Ey + F - 0 
onde A ou B ou C 0. 

Observe que a equação da cônica envolve uma forma quadrática, Q(x, y) = 
= Ax 2 + Bxy + Cy 2 , uma forma linear, L(x, y) = Dx + Ey , e um termo cons¬ 
tante F, Isto é, a equação que define a cônica é: 


Q(x, y) + L(x, y) + F = 0. 


11.4.2 Exemplos 

Circunferência 


x 2 + y 2 = r 2 


A ~ C - \ 

B = D = E = 0 
F = -r 2 



Elipse 
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Hipérbole 



Temos ainda os casos chamados degenerados 


Par de retas concorrentes (hipérbole degenerada) 
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Uma reta (parábola degenerada) 



Um ponto (elipse degenerada) 



Vazio (elipse ou parábola degenerada) 



As equações das cônicas aqui apresentadas estão na M forma reduzida", 
isto é, B = 0; se A ^ 0, D = 0 e se C ^ 0, E = 0. Veremos a seguir, através 
de uma mudança de referencial conveniente, que toda cônica toma uma das 
formas colocadas acima. 

Estamos interessados aqui nas cônicas, definidas algebricamente. No em 
tanto, cada cônica pode ser perfeitamente caracterizada por propriedades geo¬ 
métricas (por exemplo, a elipse é o lugar dos pontos do plano cuja soma das 
distâncias a dois pontos fixos (focos) é uma constante). O tratamento geomé¬ 
trico das cônicas que e a forma como elas foram introduzidas pelos gregos será 
dado em 11.7. O estudo das cônicas feito a partir de suas propriedades geomé¬ 
tricas é muito bonito e tem muitas aplicações. Vale a pena ver! 
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11.4.3 Exemplos 

Exemplo 1: 2x 2 - Sy 2 - 7 = 0 



Exemplo 3: 

Dada a equação na base canônica a de R 2 : 

2x 2 + 2 y 2 + 4xy + 4^/2x + l2\Í2y -8 = 0 

nosso objetivo, mais uma vez, será determinar que figura esta cônica representa 
no plano. Para isto, precisamos inicialmente eliminar os termos mistos, do tipo 
xy, através da diagonalização da forma quadrática. 


19 Passo: Escrevendo a equação anterior na forma matricial, temos 

[xy] 2 2 y + 12 y/2] ^j-8 = 0 

29 Passo : Vamos calcular os autovalores e os autovetores ortonormais da ma- 



P(X) = 


2-X 

2 


2 

2-X 


= (2 - X) 2 - 4 - - 4X + X 2 
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Então os autovalores são 0 e 4. 

p “* i =°-[2 2 ] [;]-[?]•' 

tj . , T2 2 m m * * , 1 _1 x 

P ‘ a • 4 ’ L 2 2 J [,J ’ [4J.J 1 d °" d ' 11 - ( VT'V2 > 


Sabemos de 10.6.1 que nesta nova base de autovetores 0 = {vj, v 2 }, a furma 
quadrática 

<2(v) = [x y] \ 2 2 * onde [vL = 

L 2 2 J L^J ^ 

se reduz a 




39 Passo: Agora precisamos determinar a relação que existe entre 
e substituir o resultado na parte linear da equação dada. 



£(v) = [ 4\f2 12V2]\ X 

y j 



[/] 


autovetores 

canônica 




49 Passo: A equação original se reduz a 
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°*> + 4 y\ + 4 \/ 2 (- ^2*' + s/2 y ^ + 12y ^ (~^ x i " 8 = 0 

4Vi - 4x, + 4y, + 12x, + 12^, -8 = 0 
4 y\ + 8x| + 1 6y t -8 = 0 
y\ + 2x, + 4y t - 2 = 0 

Esta última equação representa a cônica em relação ao novo referencia] forma¬ 
do pelas retas suporte de vi e v 2 , como mostra a Figura 11.4.1. 



Figura 11.4.1 


Vamos ainda introduzir uma nova mudança de coordenadas para identificar a 
cônica. Eia será dada por uma translação do referencial acima. 

59 Passo : Para “eliminar” os termos lineares onde isto é possível (X 0), agru¬ 
pamos os termos de y\ + 2x x +4 y x -2 = 0 convenientemente. 

iy\ + 4^ + 4) - 4 + 2x i - 2 = 0 

(y% + 2) 2 + 2(x, - 3) = 0 


Tomando x 2 = x x - 3 e y 2 = y x + 2, obtemos + 2* 2 - 6 = 0 ou fmalmente 


*2 



y\ 


Assim, a equação acima representa a cônica em relação a um novo refe¬ 
rencial R 3 , obtido por translação e podemos finalmente identificá-la como 
sendo uma parábola , conforme indica a Figura 11.4.2. (Veja 11.4.2 iv.) A ori¬ 
gem deste último referencial R 3 será x 2 ~ 0 e y 2 = 0, isto é, x x - 3 = 0 e 


+ 2 = 0. 



V 2 



Agora iremos formular o procedimento geral de classificação das cônicas, 
estabelecendo em deülhes o que deve ser feito em cada passo. 

Procedimento Geral de Classificação das Cônicas: Dada a equação 
(em coordenadas canônicas de R 2 ) 

Ax 2 + Bxy + O 2 + Dx + Ey + F = 0 (A ou B ou C * 0), 

para achar que figura ela representa no plano, devemos proceder do seguinte 
modo: 


19 Passo: Escrevemos a equação na forma matricial: 


l*y] 


A 

2 


B_ 

2 

C 


vl + [D 


L^J 

L-m 


29 Passo : Diagonalizamos a forma quadrática para eliminar os termos mistos. 
Para isto, precisamos encontrar os autovalores Xj e X 2 e os autovetores orto- 

fi 

normais v! e v 2 de z 


29 Passo. Obtemos as novas coordenadas. Para isto, precisamos para substituir 
na equação de 


- 

x 

y 


1 


[/] 


autovetores 

canônica 


x 1 

y\ 
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49 Passo: Substituímos as novas coordenadas na equação, obtendo a equação 
na nova base {vj, v 2 } 


[*i ^íl 


x, o r*j 

0 X 2 y t 


+ [D E\ [/] 


autovetores x 


canônica \y \ 


1 + F = 0 


ou seja, Xi*i + X 2 ^i + ax t + by t + F - 0 

59 Passo: Eliminamos os termos lineares das coordenadas cujos autovalores são 
não nulos. Temos então três casos: 

0 X, e X 2 4= 0. 

XiJC? + axi + X 2 ^i + byi + F = 0 

b 

Seja x 2 = x, + e y 2 = y x + temos então X,*! + X 2 ^l + f = 0 

(que é uma das equações típicas) onde 

a 2 b 2 

1 4X, 4X 2 


«) X, =£ 0 e X 2 = 0. 

X,x] + <zx, + by x + F = 0 

Xl( *' + "4, +by ' +F = ° 


Tornando x 2 = - y ii temos 

\ { xl + by 2 + / = 0 

(que é uma das equações típicas) onde 


'■'-35 


Ui) \ x - 0 e X 2 ¥= 0. (similar ao anterior) 

Como vimos, este procedimento permite-nos, através de uma mudança de 
referencial, colocar qualquer cônica na forma de uma das equações típicas 
(11.4.2). Neste processo classificamos a cônica, damos suas dimensões e posi¬ 
ções no plano. 


11,4.5 Muitas vezes, entretanto, estaremos interessados apenas em classi¬ 
ficar a cônica dada por uma equação Ax 2 + Bxy + Cy 2 + Dx + Ey + F = 0, 
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sem determinar suas dimensões e localização. Visando solucionar este problema 
de uma forma mais rapida, vamos discutir as possibilidades que temos em fun¬ 
ção dos sinais dos autovalores associados à forma quadrática 


Consideremos, portanto, os autovalores X, e L de 

i E 

2 



. Como já 


vimos, obteremos depois da eliminação do termo misto uma equação da forma 
(*) Xix? + X 2 y] + ax, + by, + F = 0 


(I) Vamos analisar imcialmente, a situação em que X, # 0 e X 2 ^ 0 Neste 
caso, através de uma translação que é feita no 5? passo de 11.4.4, obtemos 

Xi* 2 + X 2 j 2 + /= o 

Note que se: 

0 X, e A 2 forem ambos positivos, teremos para / < 0 uma elipse- para 

/ = 0 teremos um ponto (x 2 = y 2 = 0 ) e para / > 0 teremos ó conjunto 
vazio (compare com 11,4.2). 

h) Se X, e x 2 forem ambos negativos, também teremos uma elipse, um 
ponto ou vazio, conforme / seja positivo, nulo ou negativo. 

«/) Se X, e X 2 tiverem sinais opostos, poderemos ter uma hipérbole, quando 
7^0, ou um par de retas concorrentes se / = 0. 


(II) Consideremos agora a situação em que X, = 0 (e, portanto X 2 * 0) 
Como vimos, partindo da equação (*), chegamos a uma equação: 

x 2 ^ 2 + 0X 2 + / = o 

Note que: 

0 se a 0 teremos uma parábola. 

n) se * = 0, poderemos ter um par de retas paralelas, uma reta ou o vazio. 
(Analise em função dos valores de /, em que situações isto ocorre). 


(III) O caso em que X 2 = 0 é discutido de maneira análoga ao (II). 


Podemos resumir os resultados até aqui obtidos no seguinte teorema: 


11.4.6 Teorema: Dada uma cônica definida pela equação (*) Ax 2 + 

+ Bxy + Cy 2 + Dx + Ey + F = 0. Sejam X, e X 2 os autovalores associados 
a sua forma quadrática; então: 

') f 6 X ' ’ * 2 > 0 esta equação representa uma elipse, ou suas degenerações 
(um ponto ou o vazio). 
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ii) Se Xi * X 2 < 0 esta equação representa uma hipérbole ou sua degenera¬ 
ção (par de retas concorrentes). 

iii) Se Xi * À 2 = 0 esta equação representa uma parábola ou suas degenera¬ 
ções (par de retas paralelas, uma reta ou o vazio). 

Podemos afirmar que o determinante associado à forma quadrática 


é igual ao produto de seus autovalores Xi • X 2 * (Veja o Exercício 


7 de 7.5). Assim o sinal de X, • X 2 é o mesmo de -(~ - AC), que por sua 

vez tem o mesmo sinal de -(B 2 - 4 AC). Podemos assim reescrever o teorema 
anterior em função do “discriminante” B 2 - 4AC. 


11.4.7 Teorema: Dada a equaçao: Ax 2 + Bxy + Cy 2 + Dx + Ey + F - 0, 
esta equação no plano representará: 

j) uma elipse ou suas degenerações, se B 2 - 4AC < 0 
ii) uma parábola ou suas degenerações, se B 2 - 4AC = 0 
Ui) uma hipérbole, se B 1 - 4AC > 0 


11.5 QUÁDRICAS EM R 3 

11.5.1 Definição: Uma quádrica em R 3 é um conjunto de pontos cujas 
coordenadas em relação à base canônica satisfazem a equação. 

Ax 2 + By 2 + Ci 2 + Dxy + Eyz + Fxz + Gx + Hy + Iz + J = 0. 
com A oufiouCouflouFouFitO. 


11,5.2 Exemplos 

Elipsóide 



X 
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Parabolóide hiperbólico 



X 


Cone quadrático 



Cilindro 

Se nenhum termo com z aparece na equação da quádrica, temos o cihn- 
dro. 0 cilindro “padrão” é formado por retas ortogonais ao plano z = 0 que 
passam por uma cônica neste plano. Por exemplo: 
a) Cilindro elíptico 



X 
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b) Cilindro hiperbólico 



c) Cilindro parabólico 



A equação que define a quádrica pode representar o conjunto vazio 
(* 2 = -1), um ponto ( x 2 + j y 2 + z 2 = 0) 5 uma reta (x 2 + y 1 = 0), um plano 
(z 2 = 0), dois planos paralelos (z 2 = 1) ou dois planos que se interceptam 
(xj'- 0). Estes casos são denominados degenerados . Da mesma forma que foi 
feito para cônica, mostramos através de uma mudança de referencial convenien¬ 
te que toda quádrica é de um dos tipos descritos em 11.2.1. Ou seja, quando 
nos é dada uma equação do 2? grau em x, y 9 z, e precisamos saber que figura 
ela representa em R 3 (classificar a quádrica) procedemos de modo análogo à 
situação em R 2 , reduzindo a equação e interpretando-a no final. 
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11.5.3 Exemplos 

Exemplo 1 : Para classificar a quádrica 

-x 2 + 2 yz + r - y - 100. 

escrevemos a equação acima na forma matricial, obtendo: 

-1 0 0 x x 

[x y z] 0 0 1 y + [0 -1 1] y = 100 

0 1 0 z z 

Calculando os autovalores e os autovetores já normalizados da matriz 


-10 0 
0 0 1 

0 1 0 


obtemos: 


1 1 


para X, = -1; v, = (1, 0, 0) e v 2 = (°- v %’ e 

para \ 2 = 1; v 3 = (0, ) 

Temos ainda 


autovetores 
1 canônica 


autovetores 


*1 


y i 



aut. 

0 

0 

1 

i 

n 

Tf 

i 

1 


Tf 


Então, a equação da quádrica em relação a o referencial dado pelos autovetores 
será: 

r , » n ir..i fl 0 0~| r- i 


-1 0 0 x, 


[x, y, z,] 0-10 y, + [0 -1 1] 0 jj -P* = 100 

0 0 1 z t i j Z\ 

Tf TÍ 
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Isto é, 

~x\ -y\ + A -I/2 yi = 10 °- 

Faremos agora uma nova mudança de coordenadas para eliminar os ter¬ 
mos lineares onde isto é possível. 

A - x\ - O, + +y- 100 = 0 

1 

Seja x 2 = x x , y 2 - y i + ^ e z 2 = z x ; assim, temos a seguinte equação: 



que representa a quádrica em relação ao referencial obtido por translação a 
partir daquele dos autovetores, cuja origem é dada por x 2 = 0, y 2 = 0 e z 2 = 
- 0. Então 

Xi = 0, + ^ 2 ”~ ^ e z \ ~ 0 

Comparando a equação obtida com as equações das quadráticas indicadas em 
üi de 11.2.1 vemos que esta quádrica é um hiperbolóide de duas folhas. 


Biblioteca de 
Ciência & Tecnotog 
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Exemplo 2: Para achar a figura dada pela equação 

2x 2 + 2 y 2 + 2z 2 + 2 xy + 2 xz + 2yz = 81 

devemos resolver 



2 1 1 


X 

U >> 2] 

1 2 1 

1 



1 1 2 


z 


= 81 


Calculando os autovalores e autovetores respectivos (já normalizados) obtemos 


\ i ( V2 V2 m 

— 1 » v i — ( 2 » “ 2 ’ ^ 

\ \ , y/6 y/6 n / 6 ~ a 

X 2 - 1 , y 2 - ( 6 , g , 3 ) 

^3 — 4, V3 ^ ( 3^ 3 ’ 3 ) 


Ainda, 


X 

y 

|y| autovetores 

y\ 

z 

canônica 



autovetores 


onde [/] 


autovetores 

canônica 


JT 

rs 

rj 

2 

6 

3 

.. £[ 

rs 

rr 

2 

6 

3 

0 

-v/T 

/T 

6 

3 J 


Então, a equação se torna 



1 0 

-i 

0 


*i 

Ui 7 i zj 

0 1 

0 


Ji 


o 

o 

4 




ou x 2 + y\ + 4z 2 =81, que é um elipsóide. 


81 
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Como não aparecem os termos lineares, se não estivermos interessados na 
posição dos novos eixos mas apenas no formato da figura, bastaria calcular os 
autovalores, escrever a equação x\ + y\ + 4z\ = 81 e já teríamos identificado 
a quádrica. 

Também no estudo das quádricas em geral, se tivermos problemas onde 
somente a classificação destas seja importante, não interessando suas dimensões 
ou posição no espaço, poderemos resolvê-los apenas estudando os sinais dos 
autovalores associados à forma quadrática. Seria muito interessante que você 
discutisse todas as possibilidades, de modo análogo ao que foi feito em 11.4.5 
para cônicas. 


11.6 EXERCÍCIOS 

Identifique a figura e ache sua posição quando a sua equação é: 

1. 3x 2 + 2 xy + 3 y 2 - \fl x = 0 

2. 4x 2 + 4xy + y 2 - jc = 0 

3. xy + x + y = 0 

4. x 2 + xy + y 2 -3 = 0 

5. 3x 2 - 4VJxy - y 2 + 20y - 25 = 0 

6. 4 xy + 3 y 2 + 2\f$ x + 4\/Sy = 0 

7. -5y 2 + 2 xy - 8 xz + 2yz = 0 
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8. y 2 + 2z 2 + 2\/3 yz - 0 

9. 9x 2 + 16>> 2 + 25z 2 + 24 xy - 40* + 30 y = 0 
Identifique a figura. Não é necessário dar a posição. 

10. 3* 2 + 2 y 2 + 3z 2 + 2xz = 2 

11. y 2 + 2 z 2 + 2\/3 yz = 0 


11.6.1 Respostas 


^ _ 3 -1 

1. Elipse: + ^y. = i em relação ao referencial de centro no ponto ) 

64" 32 

e eixos jc 2 na direção de ( ) e 72 na direção de (- )• 



2 2 

3. Hipérbole: í*. - = 1 em relação ao referencial de centro no ponto 




(- >/í, 0) e eixos x 2 na direção de ( 


C ^ 2 na 
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5. Hipérbole: x\ - = 1 em relação ao referencial com centro no ponto 


(x íy y x ) ~ (-1, -^p) e eixos x 2 na direção de (- »-p) e na Ereção 

ri VJ) 

1 2 ’ 2 ; 



7. Hiperbolóide de 2 folhas de equação -3x 2 - 6y\ + 4z 2 = 1 em relação ao 
referencial, com centro no ponto (0, 0, 0) e eixos x l na direção de 

<7r- TF* na dire « ão ( ‘ e 2i na direção de 

( " ~7T’°’VT ) - 



9. Elipsóide de equação 125*2 + 125+ IO 6 Z 2 = 3125 em relação ao refe- 

54 

rencial, com centro no ponto (x íf y ít Zi) = (0, - ■— , 0) e eixos x 2 na 

3 4 

direção de (0, 0, 1 ),y 2 na direção de (—-, — , 0) e z 2 na direção de 


5 
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*11.7 PROPRIEDADES GEOMÉTRICAS DAS CÔNICAS 



As cônicas, ou secções cônicas, foram estudadas pelos gregos e desenvol¬ 
vidas a partir das suas propriedades geométricas. Muitos resultados aparecem 
resumidos nos trabalhos de Apollonius (260-170 A. C). 

Para apresentar estas propriedades e definir as cônicas a partir delas vamos 
estudar alguns pontos e retas especiais. 

Consideremos as cônicas na forma padrão: 


a 2 b 2 

(elipse) 

(E) 

2 2 

± -Z. = i 
a 2 b 2 

(hipérbole) 

(H) 

y 2 = Aax 

(parábola) 

(P) 


Suponhamos ainda a > b > 0. 

Para a elipse e a hipérbole, definimos os pontos: F x {-c , 0) e F 2 (c, 0) 
denominamos focos à esquerda e à direita. 

Na elipse tomamos a distância focal c = V a 7 - b 2 e para a hipérbole 
c - y/a 2 + b 2 . 

Na parábola definimos o foco como sendo F(a t 0); i.e c = a 
(veja 11.7.1): 
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11.7.1 



c 

A excentricidade e é definida pela relação e = —. 

Então, 0 < e < 1 para uma elipse (e = 0 para a circunferência); e > 1 
para a hipérbole e e = 1 para a parábola. 

As diretrizes da elipse E ou da hipérbole H são as retas: 



(O círculo não tem diretriz.) 

A diretriz da parábola P é única e é a reta x = -a. 

Se na elipse ou hipérbole tivermos ò > a, a distância focal fica sendo 
c - \/ b 2 - a 2 e c = yja 2 + b 2 , respectivamente, e os focos 7^(0,-c) e 

c b 

F 2 {Q>c). A extremidade passa a ser e =— e as diretrizes y = ±—. 


11.7.2 Exercícios 


1. Esboce o gráfico das cónicas a seguir, determinando seus focos, diretrizes e 
excentricidade. Observe depois o papel geométrico da excentricidade. 


a) x 2 + 4y 2 = 

b) 2x 2 + y 2 - 



100 

100 


d) x 2 + y 2 = 4 

e) x 2 - Ay 2 = 100 

f) x 2 - 2y 2 = 100 


1 
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^ 25 ~ 9 * k)y 2 = 4x 

h) x 2 - y 2 = 4 0 y 2 - 

i) y = x *0 3 jc 2 - 4>> 2 = 0 



2. Determine as cônicas representadas pelas equações abaixo, encontrando 
também os seus focos, diretrizes e excentricidade. 

a) 2Sx 2 + 9 y 2 - 12y - 81 - 0 
*) - 1 8y 2 + 54 jc - 36 = 0 

c) jc = 4 y 2 - \6y + f6 

3. Dê as equações da elipse, parábola e hipérbole “centradas” em um ponto 
P(m, n ) do plano e com eixos paralelos aos eixos coordenados. Encontre 
também os seus focos, diretrizes e excentricidade. 

4. Mostre que qualquer que seja o ponto P(x t y) sobre a elipse dada no 
exercício lc, a soma das distâncias deste ponto aos dois focos é igual a 10. 

Podemos agora estabelecer as propriedades geométricas das cônicas. 


11.7.3 



d(P,F l ) + d(P t F 2 ) = 2a d (F^P) - d (F 2t P) = 2a 

d(F lf Q) - d(F 2 , Q) - -2a 



d(F y P) * d (P, «) 
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11.7.4 Teorema: Considere uma cônica padrão (E), (H) ou (P) de excen¬ 
tricidade e. Então: 

1) Se 0 < e < 1 (elipse), então para todo ponto da cônica, a soma das 
distâncias deste aos focos tem o mesmo valor 2 a (Fig. 1). 

2) Se e > 1 (hipérbole), então para todo o ponto da cônica a diferença 
das distâncias deste aos dois focos tem o mesmo valor absoluto 
(Fig. 2). 

3) Se e 0, então para todo ponto sobre a cônica, a distância deste ao 
foco é igual a e vezes a distância deste à diretriz. (Focos direitos com 
diretrizes direitas, focos esquerdos com diretrizes esquerdas. Fig. 3.) 

Além disto, o que é fundamental é que cada uma destas propriedades 
caracteriza as cônicas , isto é, í) um conjunto de pontos do plano que satisfaça 
a propriedade (1) será uma elipse dada pela equação (E), em relação a algum 
referencial; 2 f um conjunto de pontos que verifique a propriedade (2) será 
uma hipérbole (H) e /) um conjunto de pontos do plano que satisfaça (2) 
será uma cônica, que satisfará (E) (H) ou (P). 

Assim, como subproduto desta proposição podemos dar as definições 
geométricas das cônicas: 

Corolário 1: A elipse pode ser definida como o conjunto dos pontos do 
plano cuja soma das distâncias a dois pontos fixos (focos) é igual a uma cons¬ 
tante. 

Note que esta constante será igual a medida do eixo maior da elipse. 

Por quê? 

Exemplo: Encontre a equação da elipse de focos em (0, 0) e (0, 8) e 
eixo maior medindo 5. 

Deixamos agora espaço para você: 

/) Definir hipérbole pela propriedade 2, 

//) Definir parábola pela propriedade 3. 


Corolário 2: 

Exemplo: 

Corolário 3: 

Exemplo: 

Finalmente dê a definição geral (geométrica) de cônica, pela propriedade 3. 

Bibliote 
Ciência & 
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Corolário 4: 

Discuta e. 

A demonstração da proposição 11.7.4. (ou dos corolários que ela engloba, 
inclusive os que você enunciou) é feita a partir do cálculo das distâncias. 

Tente fazê-las! 1 


11.7.5 Exercícios 

1. Se você fosse jardineiro e quizesse arrumar canteiros elípticos como fana? 

2. Volte ao exercício 4 de 11.7.2. O que observa? 

3. Encontre a equação da elipse com focos em (-1, 0) e (5, 0) e semi-eixo 
maior 2^3. 

4. Encontre a equação da elipse com focos em (0, 0), (0. 10) e semi-eixo 
maior 5 x/5. 

5. Encontre a equação da elipse com centro em (1, -1), semi-eixo maior 6, 
excentricidade e=ye semi-eixo maior vertical. 

3 

6. Encontre a equação da hipérbole com focos em (0, 0) e (6, 0) e e - 2 * 


7. Encontre a equaçao da hipérbole com focos em (0, -3) e (0, 5) e um vértice 
em (0,1 + VTO ). 

8. Encontre a equação da parábola com vértice em (2, 1) e diretriz * * 0. 

21 

9. Três postos de escuta estão localizados nos pontos ^4(0, 0), B( 0, ^ ) e 


o), sendo a unidade 1 quilômetro. Os microfones localizados nestes 
pontos mostram que um revólver está | km mais próximo de A do que de 

Ce lkm mais próximo de B do que de A. Localize a posição do revólver. 

(A resolução deste problema lhe dará idéia, por exemplo, de como se loca¬ 
liza o epicentro de um terremoto. São sempre necessários os dados de tres 
observatórios sísmicos.) 


‘Para consultas veja Leithold, L. O Cálculo com Geometria d 

HARBRA, São Paulo, 1977, p. 491 e 497, ou Bers, L. Calculus, Holt, R.nehart and 

Winston, Inc., New York, 1967. 



10. Encontre as retas tangentes às cônicas abaixo nos pontos indicados (use 
derivação implícita). 

a) 9y J = x em (1, -j) c) 25x 2 - y 2 = 100 em (-3, 5, 5) 

b ) x 2 + 25>' 2 = 100 em (6,-j) d) y 2 ^ 25.v em (9, -15) 

11. Cônicas em Coordenadas Polares 

Usando coordenadas polares (r, 6) no plano (x = r cos 0, y - r sen 0) 
e a definição de cônica dada por 11.7.4, parte 3, você pode deduzir de 
modo simples as equações polares das cônicas, tomando o pólo num foco 
e o eixo polar e sua extensão ao longo do eixo principal 2 . 

a) Mostre que nestas condições a equação polar das cônicas é dada por 

ed 

r ~ 1 ± e cos 0 

(O sinal + ou - é dado conforme a diretriz correspondente ao foco no 
pólo esteja à esquerda ou à direita deste.) 

b ) Dê exemplos de elipses, parábolas e hipérboles com suas formas polares. 

c) Um cometa está se movendo em uma órbita parabólica em torno do sol 
no foco F da parábola. Faz-se uma observação do cometa quando ele 
está no ponto P { a 15 milhões de quilômetros do Sol; uma segunda ob¬ 
servação é feita quando ele está no ponto P 2 a 5 milhões de quilômetros 
do Sol. 

Os segmentos de reta FP { e FP 2 são perpendiculares. Com estas informa¬ 
ções há duas órbitas possíveis para o cometa. Encontre a distância mais 
próxima que o cometa passa do Sol, em cada órbita. 

d) A órbita do planeta Mercúrio em torno do Sol é elíptica, com o Sol em 
um dos focos, tendo o semi-eixo maior 36 milhões de quilômetros e ex¬ 
centricidade 0,206. Encontre: (a) qual é a distância mais próxima que 
Mercúrio passa do Sol e (b) a maior distancia possível entre Mercúrio e o 
Sol. 

12. Equações Paramétricas da Elipse 

a) Mostre que as equações paramétricas x = a cos t e y = b sen t, a > 0, 
ó>OeO<r<27r definem uma elipse cuja equação em coordenadas 

. x 2 y 2 

cartesianas e —: +— = 1. 
a 2 b 2 

b) Mostre que as equações x = a cos (-2f) e y - b cos (-2r), 0 < t < 7T, 
definem a mesma elipse dada em (a). Encontre os “vetores-velocidade” 


2 Consulte Leithold, L. op. cit eaps. 11 e 12. 
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/ x /itr dx * dy 
nos casos (a) e (ó). (V =— i + — j) 


c) Use o item (tf) para traçar a partir de duas circunferências concêntricas 

x 2 v 2 

de raios a e b a elipse — + — = \, 


13. Propriedade Reflexiva das Cônicas 

Um exemplo de aplicação da propriedade reflexiva das cónicas é dado pelos 
espelhos parabólicos, cujo formato é obtido pela rotação de uma parábola 
em torno do seu eixo de simetria. Tais espelhos transformam uma fonte 
luminosa colocada no foco em um feixe de raios paralelos (como num holo¬ 
fote) ou, reciprocamente, podem concentrar um feixe de raios paralelos em 
um único ponto (como no telescópio). Estas propriedades são explicadas 
por dois fatores: 

i) A lei física que governa o movimento das ondas (o ângulo de incidên¬ 
cia é igual ao ângulo de reflexão). 

ii) O teorema a seguir. 

Teorema: Sejam P um ponto de uma parábola eh reta tangente à 
parábola em P. Sejam íj a reta ligando o foco a P e £ 2 a 
reta que passa por P e é paralela ao eixo, então os ângulos 
0 e a. a seguir são iguais. 



Demonstre este teorema. 

14. Num espelho com a forma de um elipsóide de revolução, toda luz que 
emana de um dos focos se reflete sobre o outro foco. Este fenômeno é 
explicado por dois fatores: (/) Lei física da reflexão: ângulo de incidência 
igual ao ângulo de reflexão, (ii) Propriedade “reflexiva” da elipse que você 
mostrará a seguir. 
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Esta propriedade pode ter usos sérios (como por exemplo num laser) 
ou jocosos como uma sala de cochichos. (Se estivermos numa sala elipsoidal 
todo o som, que também é onda, emanado de um foco será perfeitamente 
audível no outro foco.) 

Teorema: Sejam P um ponto da elipse e £ a reta tangente a esta em P. 

Sejam £j a reta ligando o foco F t a P e £ 2 a reta ligando o 
outro foco F 2 a P. Então os ângulos ô entre as retas h^e 
a entre C 2 e 2 são iguais. 



Demonstre este teorema. 
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RESOLUÇÃO DE SISTEMAS 
DE EQUAÇÕES DIFERENCIAIS 
LINEARES 


12.1 INTRODUÇÃO 

Considere a seguinte situação: Um foguete está subindo verticalmente a partir 
do solo, sujeito à força gravitacional (que é de cima para baixo e supomos 
constante e igual a mg), a uma força constante para cima e a um impulso adi¬ 
cional para cima, proporcional ao tempo t decorrido depois do lançamento. 

Que altura ele atinge t segundos após o lançamento? 

Denotando por x a altura, e usando o princípio de que força é igual a 
massa vezes aceleração (segunda lei de Newton), podemos escrever: 

m • = a + bt - mg 

at 

Ao resolvermos esta equação teremos solucionado o nosso problema. 

Este exemplo ilustra como somos levados a utilizar equações envolvendo 
derivadas. Assim como este, muitos outros fenômenos em Física, Química, Bio¬ 
logia, Economia etc., são descritos por equações diferenciais. 


1 A resolução do problema é simples, bastando integrar duas vezes a equação e impor as 


condições iniciais x(0) = 0 e v(0) 


(0) = 0 sendo v(0) a velocidade inicial. 
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Neste capitulo, presumiremos um conhecimento sobre derivadas de uma 
função de uma variável. Estaremos particularmente interessados na resolução de 
sistemas de equações diferenciais, onde sâo amplamente utilizados os conceitos 
de espaço vetorial, base, autovalores e autovetores. 


12.2 EQUAÇÕES DIFERENCIAIS 

Equações diferenciais são aquelas que relacionam uma função e suas derivadas. 
Por exemplo, as equações 


são equações diferenciais. 

Para resolver uma equação algébrica (por exemplo, x 2 - 3x + 2 = 0) 
procuramos números (1 e 2 no caso). Para resolver uma equação diferencial va¬ 
mos procurar funções que satisfaçam a equação. Por exemplo: 

x - t 1 é uma solução da equação /)♦ Uma outra solução de /) é x = t 2 + 

+ 5. O conjunto de todas as soluções de i) é expresso por x = t 2 + c, c constante* 

x = e 3 * é uma solução de //), pois ^ - = 3e v . Uma outra solução de 
ii) é x = 2e 3í . 

Podemos mostrar ainda que as soluções de ii) são exatamente as funções 
da forma x - ke 3t , sendo k uma constante. Temos, portanto, infinitas soluções 
para ii), assim como em /). 

Suponhamos agora que precisamos de uma solução de ii) tal que x(0) = 

- -5. Temos então ;*(/) = ke 3t e como x(0) = -5, devemos ter -5 = ke 3 * °, 
o que implica k = -5. Isto é, a única solução para o problema 


x(0) = ~5 (condição inicial) 


é jc(/) - -Se*. 
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De modo geral as equações do tipo de k), ou seja, 

dx 


são chamadas de equações diferenciais lineares homogêneas de primeira ordem a 
coeficientes constantes e admitem como solução geral 2 . 

x = ke at . 

Isto é, a expressão acima determina o conjunto de todas as soluções da equa¬ 
ção, variando-se o valor de k . 

Para comprovarmos que realmente é solução geral, devemos considerar as 
equivalências: 


dx dx , dx \ st 

= “°' e 


e al ax * e" al = 0 


■ e~ at ) _ 


x • e at = Á(constante) <=► x = KR 


Agora, ao invés de uma única equação diferencial, podemos considerar 
sistemas de equações diferenciais. Estaremos então procurando um conjunto de 
funções que satisfaçam simultaneamente várias equações diferenciais. Chamamos 
tal conjunto de funções de solução do sistema de equações diferenciais. Vamos 
procurar também o que chamamos de solução geral do sistema, que é uma ex¬ 
pressão que gera toda solução do sistema. 
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12.2.1 Exemplos 

Exemplo 1\ Encontre todas as funções reais diferenciáveis x x = *i(r) e 
x 2 = jc 2 (í) que satisfaçam o sistema, isto é, encontre a solução geral do sistema: 




Escrevendo o sistema (§) na forma matricial, temos 

dxjdt -3 4 x x 

dx 2 /dt ”-12 x 2 

ou ainda, 


4^-= AX, onde A 
dt 


-3 4 

-1 2 


Uma solução deste sistema é, então, uma matriz 



cujos elementos são funções que solucionam o sistema de equações (§). 

dx 

Com base na solução geral da equação — = ax, que é x = ke at (veja 

o final da secção 12.2), vamos ver se existe, para o sistema, uma solução do 
tipo: 
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a > 
b 


Neste caso, calculando -jj , temos 


dX _ d fx, 1 _ d ae 


dt dt \ x 7 \ dt be 


\be Xt b 


X a 


Para que X seja solução, devemos ter — = AX, e dessa forma ficamos com 


X a . e Xt = A a e Xt 
b b 


ou seja, 


:]■»[: 


Pensando em 


[:]■ 


v como um vetor de R 2 , a última equação se torna 


Av “ Xv 


que é exatamente a equação de autovalores e autovetores da matriz A. 

Concluímos, então, que X = \e^ ( é solução do sistema se, e somente se 
X é autovalor e v é autovetor da matriz A. 

Procurando os autovalores e autovetores de A, resolvemos 


det 


-3 - X 4 
-1 2 - X 
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Isto implica que X 2 + X - 2 = 0, ou seja, = 1 e X 2 = -2. Para Xi - 1 obte- 

i" . i 


mos o autovetor v l = j e, portanto, uma solução para o sistema será 


Xi = 


Para X 2 - 2 obtemos o autovetor v 2 = j J e teremos outra solução, X 2 
= v 2 e 2 *, isto é, 


Como X L # X 2 , vemos que X! não é múltiplo de X 2 (ou vice-versa) e dizemos 
então que X! e X 2 são soluções independentes do sistema. 

Além disto, como veremos em 12.3.1, o conjunto das soluções 


do sistema (§) é um espaço vetorial V de dimensão 2 e, portanto, duas solu¬ 
ções independentes geram V- Isto é, qualquer outra solução X é combinação li¬ 
near de Xi e X 2 . Portanto a solução geral do sistema é: 


X - J + * l 


sendo c, e c 2 constantes. Na verdade, V é um espaço vetorial complexo (veja a 
secção 12.3.1) e assim c, e c 2 são números complexos. Dependendo do in¬ 
teresse, porém, pode-se considerar apenas as soluções reais, tomando c i e c 2 


Ou ainda, como 


c,e í + 4 c 2 e' 2t 
c x é + c 2 e~ 2t 


as funções soluções do sistema são 

Xj(f) = c x é + 4 c 2 e' v 
x 2 (t) = c,e r + c 2 e 2t 
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sendo c t e c 2 arbitrários. 

Se impusermos ao Exemplo 1, colocado acima, as condições iniciais 

*i(0) = -1 e x 2 (0) = 2, 

temos: 

í*i(0 = c^e* + 4 c 2 e 2t 
[* 2(0 = c x é + c 2 e 2t 

para t ~ 0 

f-1 = Ci + 4 c 2 
\ 2 = Ci + c 2 

que implica que Ci = 3 e c 2 = -1 

Portanto, substituindo, 

Ixi = 3e* - 4e~ 2t 
x 2 - 3e' - e* 2 ' 


Esta é a única solução de 



= + 4^2 

= -X! + 2x 2 


tal que *i(0) = -1 e x 2 (0) - 2 


No exemplo anterior obtivemos dois autovalores reais distintos. O sistema 
se resolve da mesma maneira, no caso de autovalores complexos distintos, como 
foi colocado no exemplo abaixo. 

Exemplo 2\ 


dx x 

~df 


Xi - 2*2 


dx 2 

dt 


- 2x x + x 2 
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Temos 



Portanto a solução geral ê 

X = C, j e (l + 2i)t + c 2 ~i e il - 2i)t 

Ainda se faz necessário indicar outro exemplo importante, onde ocorrem auto¬ 
valores complexos. 

Exemplo 3: (oscilador harmônico simples) 



Figura 12.2.1 


Consideremos um corpo rígido de massa m preso a uma mola cuja cons¬ 
tante de elasticidade é k (k > 0). Suponhamos que não haja atrito e que a 
massa da mola seja desprezível em relação a m. Sejam u o deslocamento do 
corpo e v sua velocidade. Inicialmente, quando t = 0, o corpo apresenta-se des¬ 
locado de w 0 e parado (v 0 - 0). 

Usando a segunda lei de Newton, montamos o sistema 

f dv k 
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cujas condições iniciais são: 

u( 0) = Uq 

v(0) = 0 
Na forma matricial 



Os autovalores e autovetores da matriz são: 



A solução geral do sistema é então 

i V k/m e iJTwTT + Cj 

Impondo as condições iniciais, obtemos 



u 0 

ou seja, c l = c 2 = ~ . 




Portanto, a solução procurada é 


Resolução de Sistemas de Equações Diferenciais Lineares 325 



12.2.2 Resta-nos ainda analisar o caso de sistemas de 2 equações em 
que a matriz A admite apenas um autovalor X. Temos então duas situações: 

i) A admite dois autovetores e v 2 Ll. 

//) A admite apenas um autovetor v LI. 

No caso i) obtemos duas soluções LI, X L = e X 2 = v 2 e^ r 

A solução geral é então 

X = CjV,^ + c 2 v 2 e^ 

No caso ii) obtemos somente uma solução do tipo . Entretanto, podemos 
mostrar que existe uma outra solução Ll com a anterior, do tipo 

cit + d i\\t 

c 2 t + d 2 

Substituindo-a no sistema, encontramos os valores para Cf, c 2 , e d 2 , e 
então a solução geral é 


X ^ Cj ve^ + c 2 


Ci* + rf il e X/ 

c 2 t + ri 2 


Este método usado para obtermos uma segunda solução é conhecido como mé¬ 
todo da variação dos parâmetros 2 . 


2 Para maiores detalhes consulte, por exemplo, Pais Leme, P.J.S.; Notas de Equações 
Diferenciais Ordinárias , Impa, Rio, 1972; e Leighton, W.; Equações Diferenciais Ordi¬ 
nárias; Livros Técnicos e Científicos, Rio, 1970. 
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Você entenderá melhor este método ao resolver o Exercício 5 da secção 

12.4. 


12.2.3 Caso Geral: Só resolvemos até aqui sistemas de duas equações. Po¬ 
rém, tudo o que fizemos pode ser extrapolado para n equações, com as adapta¬ 
ções necessárias, Também neste caso a resolução é mais simples quando obte¬ 
mos n autovetores LI. 

Exemplo 

\Ax + 6 6y - 42z 
4x + 24y - 14z 
lOx + S5y - 33z 

A matriz é 




Calculando os autovalores e autovetores LI associados, temos: 

= 2 com Vj = (-11, 2, 0) e v 2 = (7, 0, 2) 

X 2 = 1 com v 3 = (6, 2, 7). 

Portanto, a solução geral é 

-11 | í 7 1 I" 6 

2 e 2t + c 2 0 e 2t + c 3 2 e ( 

0 J L 2 J k 

Vamos analisar agora os casos em que num sistema de três equações não 
conseguimos trés autovetores LI para a matriz A. 

0 Se o polinómio caractenstico é da forma (X - a) 2 (X - b), e associado ao 
autovalor a conseguirmos apenas um autovetor LI, procuramos uma ter¬ 
ceira solução independente da forma 



c 2 t + d 1 
c 2 t + di 
c 3 t + d 3 


x,(0 = 
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ü) Se o polinómio característico é da forma (X - àf , então podemos ter 

duas situações: 

a) ao autovalor a estão associados dois autovetores LI, v x e v 2 . Neste 
caso temos duas soluções LI: v x e at e v 2 e at e existe, como em /)> a 
terceira solução LI exatamente como a dada acima. 

b) ao autovalor a está associada apenas um autovetor v LI. Temos então 
uma única solução LI da forma X! = ye at . 

Neste caso mostramos que existem mais duas soluções LI da forma 


"1 To “ 

c i t + di m^r + n x t + 

X 2 = c 2 t + d 2 e at e X 3 = m 2 t 2 + n 2 t + k 2 d 21 

c 3 t + d 3 m 3 t 2 + n 3 t + k 3 

Aqui, como nos itens anteriores, as constantes, q, d it nij etc. são deter¬ 
minadas substituindo-se as soluções no sistema. 


12.3 RESOLUÇÃO DE SISTEMAS DE n EQUAÇÕES LINEARES 
HOMOGÊNEAS DE 1? ORDEM A COEFICIENTES CONS¬ 
TANTES 


Esta seção envolve um problema genérico, que consiste em procurar um con¬ 
junto de n funções reais que satisfaça, ao sistema: 



- a 11*1 + ... + ã ín x n 
= a 2 i*i + . . . + ainXfi 

= a n i^i + Qnn x n 


onde os a» s são constantes reais. Na forma matricial temos: 
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dX Av 

°u ~z — = AX. 
dt 


Uma solução será uma matriz X = : , cujos elementos são funções que 


solucionam o sistema (§). 

0 fato essencial que relaciona sistemas deste tipo com a Álgebra Linear 
é dado pelo teorema seguinte. 


12.3.1 Teorema: 0 conjunto S de todas as soluções do sistema 
: AX é um espaço vetorial (complexo) de dimensão n . 


iProva: De fato, observamos que se X 


são soluções do 


sistema, então X + Y e kX (k E C) são soluções, pois 

+ T O = jX = + AY = A (X + Y) 

dt dt dt 

Isto é, X + Y é solução. (Um procedimento análogo é usado para mostrar que 
kX é solução do sistema. 

Vemos assim que S é um espaço vetorial complexo (subespaço do espaço 
vetorial das funções definidas em R com valores complexos). Para mostrarmos 
que a dimensão de S é n, isto é, que existem n e não mais que n soluções 
linearmente independentes, precisamos do Teorema da existência e unicidadede 
solução de um sistema dê equações diferenciais com condição inicial 3 . 

12.3.2 A proposição anterior pode ser utilizada para se achar a solução 
geral de um sistema. Assim, se encontrarmos n soluções linearmente independen¬ 
tes do sistema 

= AX, X,, Xn, (isto é 4jk = AX/) 


3 A 

A demonstração deste teorema não será feita aqui, mas se voce estiver interessado 

em estudá-la veja, por exemplo, Paes Leme, op. cit. p. 56. 
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podemos gerar todas as soluçoes do sistema, e qualquer uma delas será da for¬ 
ma: 

X = CiX, + ... + CnXn (cj G C). 

Note que cada solução X t é uma matriz n X 1 de funções: 

*ii(0 

X, = 

x m(Ó 


12.4 EXERCÍCIOS 


1. Uma colônia de bactérias cresce a uma razão diretamente proporcional ao 
número de bactérias presentes. (Se chamarmos de B(t) a quantidade de 

bactérias depois de um tempo /, isto significa que B(t) = k • B(t), k = 

= constante.) Se o número de bactérias triplica em duas horas, quanto tem¬ 
po será necessário para que tenhamos cinqüenta vezes a quantidade inicial? 

Nos Exercícios de 2 a 5, dê a solução dos sistemas lineares. 

* dx 

3 - p = - s * 

dy 

[ * = 

com condição inicial *(0) = 1, >>(0) = 2 



4 . = + 19^ + 4 z 

- = -3x + 7 y + z 

dt 

-$- = -7x + 17^ + 2 z 

dt 


5. 


dx 

dt 

dy 

dt 


= x + y 
= -x + 3y 
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6. Num circuito LC, seja um indutor de indutáncia L ligado em série com um 
capacitor de capacitância C Seja i a corrente que circula no circuito e q a 
carga no capacitor. 


Suponhamos, inicialmente, que a corrente no circuito seja i 0 e o capacitor 
tenha uma carga q 0 . Sabendo que a diferença de potencial no indutor é 
di q 

I — e no capacitor é temos o sistema de equações diferenciais 


Encontre as expressões da carga e da corrente em função do tempo. 


12.4.1 Respostas 

2 fin 50 


2. x(f) - Cie‘ + 3 c 2 e~ t 
y(i) = c,e f + 5 c 2 e~ f 

3. x(í) = e~ st 
y(t) = 2e~ st 


4. x(t) = (9 - 4r)e* + c 2 (9 + 4 i)e' u + 3c 3 

y{t) = c,(3 - i)^ + c 2 (3 + />"" + c 3 

z(t) = Cj(7 - 2 i)e ü + c 2 (7 + 2i)e' il + 2c 3 


5. Solução: A matriz associada é A 


1 1 

-1 3 * 


X = 2 e v = j , o único LI. Uma solução é Xj = j e 2t . 
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Outra solução LI é do tipo 




(c, + c 2 )t + (di + d 2 ) „ 

(3c 2 -c,)í + (3 d 2 -d ^J 

Igualando ( i ) e («), temos: 

2 c x t + 2ú? t + Ci = (c { + c 2 )t + d t + d 2 
2c 2 t + 2 d 2 + di - (3c 2 - cOr + 3tf 2 - d x 

Como isto é uma identidade de polinómios, igualando os coeficientes, 
temos: 

-C\ + c 2 - 0, -di + d 2 = c ly -c x + c 2 - 0 e -d x + d 2 = c 2 
Portanto, c x - I, c 2 = 1, d x = 0 e d 2 = 1 e 



A solução geral é 


x(t) = k x e 2t + k 2 te 2t 
y(t) - /^e 2 ' + Á 2 </ + l)e 2 ' 



6. i(t) = ake kt + pke’ kt 
q{t) = - $e kt 


onde a = 


io + kq 0 
2k 




/o - 

2 k 


e 
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PROCESSOS ITERATIVOS E 
ÁLGEBRA LINEAR 


13.1 INTRODUÇÃO 

Em qualquer problema concreto é necessário não apenas saber que uma solução 
existe, mas também chegar a esta solução em termos numéricos. Os problemas 
que aparecem na prática, no entanto, envolvem tantas variáveis ou são tão difí¬ 
ceis que tornam-se praticamente impossíveis de serem resolvidos sem o uso de 
recursos como calculadoras, computadores etc.. (Tente, por exemplo, resolver 
um sistema linear de 100 equações e 100 incógnitas.) Há necessidade, então, de 
desenvolver processos numéricos que possam ser usados em computação eletrô¬ 
nica. Estes processos podem ser divididos em dois grupos: processos exatos e 
processos iterativos. 

Por um processo exato entendemos um processo através do qual se obtém 
a solução numérica de um problema por meio de um número finito de opera¬ 
ções elementares. O método de resolução de sistemas lineares por redução da 
matriz, que vimos no Capítulo 2, é um exemplo de processo numérico exato 
que pode ser programado e usado em computadores (embora para este fim 
existam outros métodos exatos de resolução de sistemas lineares que são me¬ 
lhores, como o método de Gauss que utiliza uma quantidade menor de opera¬ 


ções, reduzindo o tempo de uso do computador e possibilitando, conseqüente¬ 
mente, uma maior economia). 

Um processo iterativo de resolução de um problema é um processo em 
que se obtém uma sequência de soluções aproximadas do problema, tal que 
cada termo da seqüência é obtido a partir dos anteriores por um processo bem 
determinado e que, num certo sentido, está “cada vez mais perto” da solução 
correta do problema. 

A escolha de um ou outro processo (quando houver esta possibilidade) 
vai depender de uma série de fatores: da precisão desejada dos resultados (e 
aqui devemos ressaltar que a expressão processo exato não quer dizer que se 
encontre a resposta correta, sem erro algum. Este erro quase sempre aparece 
na prática, pois as máquinas calculadoras têm apenas um número finito de dí¬ 
gitos e assim, em cada operação haverá um erro de arredondamento), da capa¬ 
cidade de memória do computador empregado, do tempo despendido em com¬ 
putação, do problema em particular. Por exemplo, o processo iterativo é me¬ 
lhor quando as matrizes envolvidas são esparsas, isto é, com muitos zeros, ou 
quando existe uma fórmula para calcular os elementos da matriz, evitando que 
seja necessário o armazenamento etc. Por razões técnicas, durante vários anos 
houve preferência generalizada pelos processos iterativos, mas com o desenvol¬ 
vimento de computadores em grande capacidade de memória e rapidez, os pro¬ 
cessos exatos voltaram a ser interessantes do ponto de vista prático e, atual¬ 
mente, são competitivos com os processos iterativos. Estes últimos, no entanto, 
continuam a ser muito importantes e serão os que estudaremos aqui através de 
sua conexão com Álgebra Linear. 

Suporemos que você saiba um pouco (não muito) sobre limites e seqüên- 
cias de números. 


13.2 SEQÜÊNCIAS DE MATRIZES 

Começaremos considerando uma seqüência infinita de matrizes de ordem r x s y 
Aj, A 2 , ...» A n , A rt + i, ..., onde 
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com todos os a,y números reais ou complexos. Representamos tal seqüência 
por {A„}„ €N 

13.2.1 Definição: Dizemos que a sequência {A„} rt e=N de matrizes con¬ 
verge para (ou se aproxima de, ou ainda tem como limite) a matriz A = [ a ,y] 
(de mesma ordem) se os elementos das matrizes A„ se aproximam dos elemen¬ 
tos correspondentes da matriz A, isto é, 

(«) í i = 1, 2, ..., r 

S?-“« ., 

Neste caso, usaremos a notação 


lim A* = A ou A„ A 
n+ oo 


Exemplo : Seja a seqüência {A W }„^ N onde 


1 i ^ 5 

— 1 + ~j 

n n 

. 3 * + 1 

2n 


“1 1 9 
1 6 A 24 

'l O ^2 “ ^ 


3 2 , 


2 4 etc. e lim A„ = ^ * 

o 7 n+ 'i A. 

4l * 2 


Um caso particular importante da definição anterior é quando as matrizes 
são vetores-coluna, X„. Neste caso, 


^X= : 


se lim X/ = x/ para í = 1, 2, ..., r. 

tf > co 


13.2.2 Definição: Usando as notações da definição 13.2.1, dizemos que a 
série de matrizes (soma de infinitas matrizes) 

Ai + A 2 + ... + A* + A„+ i + ... 

tem como soma uma matriz S e escrevemos S = Aj + A 2 + ... se a seqüência 
{B* } n en > onde B„ = Aj + ... + A„ tem como limite a matriz S, isto é, 

lim (A! + A 2 + - + A„) = S 

tf* oo 
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Como o limite de uma seqüência de matrizes é formado pelos limites dos 

elementos, certas propriedades de limites de seqüências de números também são 

válidas para seqüências de matrizes. Por exemplo, constantes multiplicativas 

podem ser colocadas fora do limite em seqüências numéricas, isto é, 

lim k • a n = k • lim a n , o mesmo valendo para matrizes. Isto é, se Q] e 
n * co tf* °° 

Q 2 são matrizes constantes, então 

lim 0Qi • A„) = Qi • lim A n e lim (A„ * Q 2 ) = (lim A n ) • Q 2 , 

tf* CO n+o° tf*oo n + oo 

desde que sejam possíveis as operações. 

Os resultados que vêm a seguir mostram outras situações em que, sob 

certos aspectos, as seqüências de matrizes comportam-se como seqüências de 

números. A primeira delas é que, dado um número real ou complexo j, com 

| g | < 1, as potências de |tf| são números cada vez mais próximos de zero, isto 

é, lim \a\ k = 0, e portanto lim a k = 0. Além disso, se |ü| > 1, lim a k não 
fc* oo k+o o k+ oo 

é zero. 

Você deve conhecer ainda que se tivermos uma seqüência de números que é 
uma progressão geométrica de primeiro termo 1 e razão a , com \a\ < 1 , então 
a soma dos termos (infinitos) desta progressão existe e é dada por 

i 2 k 1 

1 + a + a 2 + ... + a K + ... = ,- 

1 - a 

Estes dois resultados também são válidos (com certas modificações) para 
seqüências de matrizes, como veremos nos teoremas 13.2.4, 13.2.5 e 13.3.7. 

No que se segue, estaremos considerando todos os autovalores de uma 
matriz quadrada A, inclusive os complexos, mesmo que A tenha apenas elemen¬ 
tos reais. 

13.2.3 Teorema: Seja A uma matriz quadrada rxr, Então lim A* = 0 

k+ oo 

(matriz nula r x r) se e somente se todos os autovalores de A têm módulo me¬ 
nor que 1. 

Prova : Suponhamos que A seja diagonalizável. Existe então uma matriz inversí- 
vel, Q, tal que 

\ 0 
0 X 2 

Q' 1 AQ = . 

0 ... 

onde os X,* são os autovalores de A, isto é, 
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Vê-se facilmente (por indução) que 



E portanto, 



Como |X, | < 1, |X 2 | < 1, |X r l< 1, então lim X* = 0 para i = 1, r 

Jt* ©o 

e portanto, 

lim A* = Q • 0 • Q" 1 = 0 

k+ OO 

Vamos mostrar agora que, se lim A k = 0, então |X,-| < 1 parai = 1, ...,/\ 

k+ oo 

Suponhamos, por absurdo, que um dos autovalores, por exemplo o \ lt tem 
módulo maior ou igual a 1. Então, lim X k =£ 0. Dessa forma 

k+ oo 


lim A* 
k + o © 


o 1 # o 


o que contradiz o fato inicial de que lim A* = 0. Portanto, todos os autova- 

k + oo 

lores devem ter módulo menor que 1. 

O caso geral, isto é, quando A não é diagonalizável, é feito de modo aná¬ 
logo só que, no lugar da forma diagonal, é usada a forma de Jordan. Depois, 
tente fazer esta demonstração, como exercício. A dificuldade estará em se esta¬ 
belecer a expressão da w-ésima potência da forma de Jordan da matriz A. 

Vejamos mais uma situação em que as sequências de matrizes apresentam 
um comportamento semelhante às seqüências de números. 
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13.2.4 Teorema: Seja A uma matriz quadrada rxr. Então, lim A k = 0 

k+ oo 

se e somente se I - A é uma matriz inversível e I + A + A 2 + ... + A* + ... = 

= (I - A) -1 , onde I é a matriz identidade rxr 

Prova : Suponhamos primeiro que I + A + A 2 + ... + A* + ... = (I - A) -1 , isto 
é, que lim (I + A + ... + A k ) = (I - A)" 1 . 

k+ co 

Portanto, lim (I + A + ... + A* + A* +1 ) = (I - A) -1 . 

k+ oo 

Subtraindo as duas igualdades, temos 

0 = (I - A)-' - (I - A)" 1 = lim (I + A + ... + A* + A* +1 ) - lim (I + A + ... + A* 

k + oo k+oo 

= lim A* + 1 = lim A k . 

k + oa k+oo 

Suponhamos, por outro lado, que lim A k = 0. Pelo teorema anterior vemos 

que os autovalores de A têm módulo menor que 1 e, portanto, o número 1 
não é autovalor, o que implica det (A - 1 * I) # 0. Então, a matriz A - 1 • I 
é inversível. Assim, I - A também é inversível e (I - A) -1 existe. Vale ainda 
a identidade 

(I + A + A 2 +... +A*) (I - A) = I - A**'. 

Multiplicando pela direita por (I - A)~*, temos 

I + A + A 2 + ... + A* = (I - A)" 1 - A* +1 (I - A)‘ l 

Então I + A + A 2 + ... + A* + ... 

- lim (I + A + ... + A*) = lim [(I - A) 1 - A^ + ! (I - A) 1 ] 

k + oo k +oo 

= (I - A)" 1 pois lim A* +1 = 0. 
k+<*> 

Reunindo os resultados dos dois teoremas anteriores obtemos: 

13.2.5 Corolário: Se A é uma matriz quadrada, então os autovalores de 

A têm todos módulo menor que 1 se, e somente se a matriz I - A é inversível 
e vale 

I + A + A 2 + ... + A* + ... = (I - A)' 1 . 


13.3 RESOLUÇÃO DE SISTEMAS LINEARES - PROCESSO 
ITERATIVO 

Vejamos, agora, como esses fatos podem ser usados para resolver sistemas 
lineares. Consideremos o sistema: 
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Í1,03jc - 0,02>- = 7 
|0,01* + 0,90/ = -5,2 

Observamos que ele pode ser colocado na forma 

x = -0,03* + 0,02/ + 7 
/ = -0,01* + 0,10/ - 5,2 

ou na forma matricial 

* _ -0,03 0,02 * 7 

/ - [-0,01 O.IOJ [/J [-5,2 

Chamando X = *,M= eN= , vemos que uma so¬ 

lução do sistema é exatamente um vetor-coluna X que satisfaça X = MX + N. 

Queremos saber se existe algum processo iterativo para determinar tal X. 
Iniciemos o processo com um vetor qualquer Xj. Por exemplo, tomemos Xj = 

. Se calcularmos 



X 2 = MX, + N = 


-0,03 

- 0,01 


0 , 02 ' 

0,10 




e se usarmos o vetor obtido para obter X 3 , teremos 


x 3 = mx 2 + N = 


-0,03 

- 0,01 



Analogamente, se usarmos X 3 para obter X 4 , teremos 


X* = MXj + N = 


-0,03 

- 0,01 


0 , 02 " 
0,10 


6,6867] 

-5,7907] 



' 6,683585' 
-5,845937 


Se em cada passo procedermos analogamente, isto é, uma vez obtido X n , obte¬ 
mos X„ + , pela fórmula X n+1 = MX n + N, teremos montada uma seqüência 
{X n }«£N de vetores-coluna. Será que estes vetores X„ estão se aproximando 
de um vetor X que seja solução do sistema? Verifiquemos isto. Naturalmente, 
o sistema pode ser resolvido de forma usual (por exemplo, por substituição) e 
a solução é 

650788 -6056 

* " 97541 6 y ~ 947 
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Efetuando as divisões, teremos x % 6,6824849 e y ^ -5,8520276. Compare 
esses resultados com os obtidos em X 4 . 

Surge uma pergunta natural: em que condições teremos a repetição do 
que parece acontecer neste exemplo? Em outras palavras, quando a seqüência 
X n se aproxima de um vetor. X, que é solução do sistema? O próximo teore¬ 
ma nos dará uma resposta a esta pergunta, fornecendo um método iterativo de 
resolução de sistemas lineares que satisfaça determinadas condições. Antes de 
enunciá-lo e demonstrá-lo, precisamos estudar a relação entre as formas AX = 
zfieX = MX + N de um sistema. 

Normalmente, um sistema vem dado na forma AX = B. Entretanto, se 
quisermos aplicar um procedimento semelhante ao usado no exemplo anterior, 
esta forma não é satisfatória. É preciso colocá-lo na forma X = MX + N. Isto 
pode ser feito de várias maneiras. Uma delas é a que foi usada no exemplo: 

AX = [I + (A - I)]X = X + (A - I)X = B, 

ou seja, X - (I - A)X + B, e então tomamos M = I - A e N = B. O modo 
como são escolhidos M e N em função de A e B é importante na prática, e 
em 13.3.9 voltaremos a comentar este assunto. No momento, estamos apenas 
interessados na situação em que M e N já foram obtidos e então, começando 
com um vetor-coluna qualquer X!, montamos uma seqüência {X„}„e N itera¬ 
tivamente pela fórmula X„ +1 * M • X* + N. Queremos saber, então, em que 
condições a seqüência obtida se aproxima de uma solução do sistema. Como 
já dissemos, a resposta é dada pelo teorema a seguir. 

13.3.1 Teorema: Se um sistema linear é dado na forma X = MX + N, 
onde M é uma matriz quadrada tal que todos os seus autovalores tenham mó¬ 
dulo menor que 1, então, iniciando por um vetor-coluna qualquer Xi, a se¬ 
qüência de vetores-coluna obtida pela fórmula 

X„ +1 = MX„ + N 

tem como limite um vetor-coluna X que é solução do sistema X = MX + N. 
Dizemos, neste caso, que a seqüência converge para uma solução do sistema. 

Prova: Temos 
X 2 =MX Í + N 

X 3 = MX 2 + N = M(MX, + N) + N = M 2 X, + (I + M)N 
X 4 = MX 3 + N = M[M 2 X, + (I + M)N] + N = M 3 X, + (I + M + M 2 )N 
e, procedendo por indução, obtemos 

X„ = M" _1 X, + (I + M + M 2 + ... + M”" 2 )N. 

Como M tem todos os autovalores com módulo menor que 1, pelo corolário 
13.2.5 e pelo teorema 13.2.4, temos 
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lim (I + M + ... + M"- 2 ) = (I - M)-‘ 

n + o o 

lim M 71 " 1 £= 0. 

n+ oo 

Portanto, lim X„ = lim [M^X, + (I + M + ... + M 71 ' 2 )^ = 

n -voo n+ oo 

= (I - M )' 1 N. 

Concluímos, então, que lim X„ existe e chamemos 

rt+oo 

X = (I - M)-'N « lim X„. 

n + o© 

Tomemos agora o limite quando n -v oo dos dois membros da igualdade X w+1 3 
= M X n + N. Temos lim X n + l = lim (MX„ + N) - M " lim X n + N, ou 

A2 > 00 n >00 rt + oo 

seja, X = MX + N e, portanto, X = lim X„ é solução do sistema. 

n +oq 

0 teorema que acabamos de ver é típico dos teoremas que aparecem em 
processos iterativos. Ele fornece um processo de construção mecânica de uma 
seqüência que, sob certas condições, aproxima-se da solução do problema. Não 
é vantajoso aplicar manualmente estes processos, mas estes parecem bastante 
razoáveis quando se dispõe de uma calculadora automática programável. 

Entretanto, este teorema apresenta uma limitação muito séria na prática. 
Como verificar concretamente se uma dada matriz (geralmente de ordem alta) 
tem autovalores com módulo menor que 1 ? Calcular os autovalores seria uma 
resposta óbvia, mas não temos meios práticos e rápidos de fazer isto com ma¬ 
trizes de ordem alta (a não ser, talvez, por outros processos numéricos iterati¬ 
vos). Vamos ver, então, se conseguimos dar uma resposta bem simples e rápi¬ 
da, apenas examinando os elementos da matriz. Para isto definimos: 

13.3.2 Definição: Seja A = x s uma matriz. Chamamos de norma da 
tnatriz A e denotamos por ||Aj|, o número não negativo 

IlAll = máx V \au\ 

Kí«r L 1 
7=1 

Exemplo : Se 



então IIAII = máx {121+ Ull, Í8I+ l0l} = máx {3, 8} = 8. 

O caso particular da definição anterior em que a matriz é um vetor-coluna 
n x 1 é muito importante e por isso vamos repetir a definição neste caso parti¬ 
cular, dando um nome especial. 
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13.3.3 Definição: Seja 



um vetor-coluna. Chamamos de norma do máximo do vetor-coluna X ao núme¬ 
ro 

llXil = máx { \x { I, lx 2 I, \x n 1} 

Observação : No Capítulo 8, ao lidarmos com espaços vetoriais munidos 
de um produto interno (, >, demos o nome de norma de um vetor v ao núme¬ 
ro llvll = <v, v>. A noção que estamos apresentando aqui não provém de um 
produto interno, mas continua recebendo o nome de norma porque possui vá¬ 
rias propriedades em comum com o conceito introduzido no Capítulo 8. 

Vejamos algumas propriedades. 

13.3.4 Teorema: Consideremos uma seqüência de matrizes \ n = [a\^] rXs 

e uma matriz A = |d r xs, tais que lim II A„ - All = 0. Então lim (A„ - A) = 0, 
* ti + 00 n > 00 

ou seja, lim A„ = A. 

n+ 00 

s ^ 

Prova : Temos lim II X n - All = lim máx ( V* lajj - aij I) = 0 

n+o o , «^00 

7=1 

Então para todo í = 1, ..., r, temos 

lim V \d$ - ü(j \ = 0 

n -VOO Z-í 

7=1 

Mas, se a soma de termos positivos tende a zero, cada uma das parcelas também 

tende a zero. Logo, para todo i = 1, r e 7 = 1, ..., s temos lim I a\j - aij\ - 0, 

n -voo 

ou seja, lim (a^ = 0. Assim, lim (A rt - A) = 0. 

J 14-00 1 n+ o° 

13.3.5 Teorema: Sejam A e B duas matrizes de mesma ordem e X um 
número. 

i) IIAll = 0 se, e somente se A = 0 
íi) IIA + Bll < IIAll + HBll 
Ui) IIXAIÍ - IXI IIAll 

Prova: Faça como exercício. Ao provar (w) lembre que se a e b são números, 
então \a + b\ ^ \a\ + Ibl. 


Biblioteca 
Ciência & T< 
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Observe que as propriedades do teorema anterior são três das proprieda* 
des da norma definida no Capitulo 8. A norma definida aqui, embora não pro¬ 
venha de um produto interno, tem também essas propriedades. 

Vamos precisar, ainda, de mais uma propriedade desta norma para de¬ 
monstrar os resultados seguintes. 

13.3.6 Teorema: Se A = [tf/fclrXs e B = [fyt/JsXf são duas matrizes, 
então IIA • Bll < IlAll • llBlI. 


Prova : Temos A • B = [cy 7 -] rX f onde cy = £ a ikf ) kj 

k= 1 

t t s 

Então IIA • Bll = máx V lc»l = máx ( V I V I) < 

/=! hl km\ 


t s 


< máx [ 

l^i 

i 

( £ 1**1 

ll 

“Sr 


7=1 




s 

t 


= máx ( 

I 

\a ik \ £ 

l%l) < 

k=l 

/= 1 



s 



< máx [ 
\<i<r 

E 

1- 1 

\a ik 1 (máx 

1^ k ^ 

s I '^/Dl 


k~\ j~\ 



Uma situação particular desta proposição é quando B é um vetor-coluna X. 
Temos então 11A • XII < 11A11 * ilXll. Vamos ver agora qual é a Ligação que 
existe entre a norma de uma matriz e seus autovalores. 


13.3.7 Teorema: Se A é uma matriz quadrada tal que IIAII < 1, então 
todos os seus autovalores tém módulo menor que 1. 

Prova\ Pelo teorema 13.3.6, temos IIA 2 lí = IIA • All < IIAII • IIAII < IlAll 2 
e, indutivamente, IIA*II < IlAll*. Como IlAll < 1, temos 

0 < lim IIA*II < lim IlAll* = 0 

k+oo k+oo 
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ou seja, lim II A*II = 0 e, portanto, pelo teorema 13.3.4 lim A* = 0 . 

K +0O Iç+oo 

Usando, então, o teorema 13.2.3, vemos que os autovalores de A têm módulo 
menor que 1 . 

Incluindo este último resultado no teorema 13.3.1, obtemos o seguinte 
teorema que fornece um critério para determinar se um sistema tem solução 
obtida através do processo iterativo. 

13.3.8 Teorema: Se M - (Ay]/-xr é uma matriz tal que llMll - 
r 

- nráx V l^i/l < 1 e N é um vetor-coluna r x 1 , então, qualquer que 
/= 1 

seja o vetor-coluna inicial Xj, a seqüéncia de vetores-coluna, dada pela fórmula 
iterativa \ n + ^ = M • X n + N, aproxima-se de um vetor-coluna X que é solução 
do sistema linear X = M * X + N. 

Como este último resultado pode ser usado na prática? Como já comen¬ 
tamos, um sistema que normalmente aparece na forma A * X = B sempre pode 
ser colocado (de vários modos) na forma X = M • X + N. A resolução do teo¬ 
rema anterior pelo processo iterativo, é viável, desde que esteja satisfeita deter¬ 
minada condição sobre M. Dependendo da maneira como colocamos o sistema 
na forma X = M • X + N, esta condição (suficiente) sobre M vai se refletir de 
maneira diferente sobre A. 

Por exemplo, na escolha sugerida, isto é, M = I - A e N = B, se A = 

= [ a if)r xr» a condição llMll < 1 é a de que III - All = máx {ll - a [t I + 

+ ltf /2 i + ... + Itftf*!} < 1. Isto significa em termos intuitivos que para esta es¬ 
colha de M e N o processo iterativo converge se a matriz de coeficientes A do 
sistema for razoavelmente próxima da identidade. 

Para conseguirmos convergência em outras situações, precisamos fazer 
outras escolhas para M e N. Nos meios computacionais, estas outras escolhas 
para M e N são feitas seguindo o principio enunciado abaixo. 

13.3.9 Princípio: Dado o sistema A - X = B, escrevemos A = P - Q, 
onde P é uma matriz inversível. Então 

A • X = (P - Q)X = P- X- Q- X = B 
ou P * X = Q * X + B 
ou ainda X = (P 'Q)X + P L B. 

Então M = P _1 Q e N = P~ ] B. 

Este princípio pode ser ilustrado, desenvolvendo um processo que denominamos 
Método de Jacobi. 
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13.4 MÉTODO DE JACOBI 


flu tfi 


Se A- 


com an ^ 0, i = 1, ..., r, 


L^ri - a rr\ 
podemos escrever 


"n 

0' 


' 0 

a 12 . 

• "ir 


a 2 2 

*• 

+ 

"21 

. 

"2 r 

0 

L 

Cl 

i _ 


_ a r\ 

a r 2 

0 


Como a a ^ 0, a matriz diagonal é inversível e sua inversa é 


_1 <*xi 


Podemos tomar então em 13.3.9 


"ll 

"1 

0 

e Q = 

r 0 
-tf 21 

~ a \2 

0 

“tf ir 

-a 2r 

0 

a rr _ 


J Q r\ 

~ a n - 

0 


Neste caso 


o processo 

iterativo 

obtido é 


0 

“tf 12 

tfll 

■tf ir 

tfii 


“"21 

o 

“ tf 2r 

M = 

tf 22 


tf 22 


~ a r\ 

“tfra 

0 


a rr 

a rr 


A condição IIMil < 1 para a convergência do processo iterativo é então que 
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ou seja, 


-tf 12 I . 

■■ + ãlr < 

tfll 1 

"11 

—tf 21 , 

.. + ~° 2r < 

tf 22 

"22 

“tfri + 

... + 

a n 

a rr 

| "|2 | + | "l3 | 

+ ... + | a lr | 


a n + | Urt | + - + \ a r,r -1 < a r r 


Em outras palavras, no Método de Jacobi, a condição de convergência do pro¬ 
cesso é a de que cada elemento da diagonal seja, em módulo, maior que a so¬ 
ma dos módulos dos elementos que estejam na mesma linha. 


13.5 PROCESSO DE GAUSS-SEIDEL 


Um outro processo muito usado na prática é o chamado processo de Gauss- 
-Seidel. Considerando uma matriz A = k*y] r xr com diagonal sem zeros 
(aa 0, / = 1, r), escrevemos 



em seguida tomamos 



Note que P é inversível, pois os elementos da diagonal são não nulos e ela é 
triangular inferior. Neste processo é um pouco mais difícil escrever M e N, mas 
você deve tentar. Como você poderá verificar também, a condição IIMII < 1 é 
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muito mais complicada de se expressar em termos da matriz A. Costuma-se, 
assim, trabalhar com uma outra condição suficiente (critério de Sassenfield). 

n 

Mas você pode verificar que a condição ^ \ay\ para i = 1,2, n 

;=l 

estabelecida no método de Jacobi também é uma condição suficiente para a 
convergência no processo de Gauss-Seidel. Você encontrará a prova destes cri¬ 
térios, bem como um grande número de exemplos, na bibliografia citada no 
final do Capitulo, 

O método de Gauss-Seidel costuma ser muito vantajoso nos casos onde a 
matriz é de ordem elevada e há poucos elementos diferentes de zero. 


13.6 ESTIMATIVA DE ERRO 

Dado um processo iterativo X„ + i = MX„ + N com llMll < 1, sabemos que o 
processo converge, isto é, a seqüência aproxima-se de um vetor-colu- 

na X que é solução da equação X = MX + N. 

Resta, entretanto, um problema prático: uma vez que não conhecemos a 
priori a solução X (na verdade é isto que queremos achar) como saberemos 
quando os X„ estão suficiente mente próximos de X? lntuitivamente a resposta 
é: calculamos os termos X w , X w +i, etc. e em cada passo comparamos o valor 
obtido com o anterior, isto é, X w + t com X n . Quando X rt + i estiver próximo 
de Xn é porque provavelmente os termos não se alteram muito a cada passo e 
podemos dizer que X rt + 1 está próximo de X. 

Esta resposta intuitiva apresenta problemas sérios. Primeiro, o que signifi¬ 
ca exatamente a palavra próximo ? Como podemos medir isso de forma que 
uma calculadora automática possa nos responder quando estamos “próximos ? 
Segundo, como podemos justificar a nossa intuição? Terceiro, na prática pre¬ 
cisamos saber exatamente qual é o erro cometido ao pararmos o processo ite¬ 
rativo num determinado passo, e não apenas saber que estamos próximos. 

Quanto ao primeiro problema, podemos solucioná-lo utilizando a noção 
de norma. Por exemplo, se 



então IIX „ +1 - X„ll = máx {lx ( ," +,) - x\ n) \ . l4” + °- e - portanto. 
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se a norma da diferença de X /í+1 - X n for pequena, os elementos correspon¬ 
dentes dos vetores-coluna estão próximos. 

Os dois outros problemas serão resolvidos de uma forma conjunta. Quere¬ 
mos saber qual o erro cometido ao pararmos o processo iterativo num certo 
passo. Vamos calcular, então, IIX^ + j - XII, onde X é a solução do problema 
X = MX + N. Para isto, sabemos que X„ + 1 = M . X* + N e X = M • X + N. 
Subtraindo termo a termo obtemos 

X„ + l - X = M . X„ - M . X 

Subtraindo M • X„+i, dos dois membros da última igualdade obtemos 
X M + 1 - X - M - X ff +i = M • X„ - M • X - M • X* + 1 
ou X n+l - X - M • X„ + 1 + M’X = M'X„-M' X„ +1 
ou ainda (I - M) (X„ + 1 - X) = M(X„ - X n+1 ). 

Com a hipótese llMll < 1 (para o processo convergir), aplicando o mesmo ra¬ 
ciocínio que em 13.2.5, vemos que I - M é inversível e que 

a) (I - Mr 1 = í + M + M 2 + ... 

Então X n + l - X = (I - M )- 1 • M(X„ - X rt + 1 ) 

Tomando as normas dos dois membros e lembrando 13.3.6, chegamos a 

b) IIX„ + 1 - XII < 11(1 - M)- 1 II - llMll • IIX„ - X„ + 1 II 

Usando 13.3.5 (//) e 13.3.6 em (d), obtemos 

11(1 - M)-' II = III + M + M 2 + ...II « I + llMll + IIMIP + ... = --íy^ji 

Colocando esta expressão em (£), temos o teorema seguinte. 

13.6.1 Teorema: Consideremos o processo iterativo X w+1 = MX„ + N 
com llMll < 1. Então a seqüência {X„}„£n converge para a solução X do 
problema X = MX + N, de tal modo que 

+ 1 - Xll < prjjMfj 1 “ ^ 

Assim, o teorema justifica o nosso procedimento intuitivo e nos dá um 
meio dé calcular o erro cometido ao pararmos o processo em um determinado 
passo. Por exemplo, se quisermos achar X com uma precisão de £, deveremos, 
a partir de um X 0 qualquer, seguir o processo iterativo até que 

IIX „ +1 - XII < ,IX * + * - X » 11 < e, 

isto é, até que a norma da diferença de um termo com o seguinte, 

,, . £(i - IImII) 

llXfl + i - X„ 11 , seja menor que |J^[]—“ 
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13.7 EXERCÍCIOS 


2 0,1 1 

1. Seja A - 3 4 0 

_0 1 8 _ 

a) Calcule IIAII. 

b ) Ao resolvermos o sistema 


X 


3 

y 

= 

0 

z 


_1 _ 


podemos garantir que o processo iterativo dado por X n = MX + N onde 
[ 3" 

M = I - A e N = 0 converge para urna solução do sistema? 

b 1J 

2. Se M é uma matriz quadrada tal que llMll < 1, sabemos que seus autovalo¬ 
res têm módulo menor que 1 . A reciproca é verdadeira? Isto é, se os auto¬ 
valores têm módulo menor que 1 , então necessariamente IIMII < 1 ? 

3. O sistema linear 

f - 5x + 2 y + z s= 2 

j x + ly + i = 2 

l * + y - 5 z = 2 

pode ser resolvido pelo Método de Jacobi? Se puder, calcule X 3 a partir de 


X, = 1 


4. Resolva o sistema linear 

' 6x + 2y - 3z = 5 

- -x + 8 >> + 3z = -10 

, x + 4y + 12z = 12 

pelo (a) Método de Jacobi (b) Método de Gauss-Seidel, a partir de 
1 

X, = 1 , isto é, ache X 4 e faça uma estimativa do erro IIX 4 -XII, onde 

_ lj 

X é a solução correta do problema. O que você pode dizer sobre as veloci¬ 
dades de convergência dos dois métodos? 


5. Prove o teorema 13.3.5. 
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13.7.1 Respostas 

1. a) IIAiI = 9 

b) Não podemos garantir pois llMll > 1 . 

_22_ 6/7 

32 32 

6/7 10 

32 x/72 

no entanto seus autovalores são 0,875 e 0,125 aproximadamente. 

3. Pode, pois o módulo de cada elemento da diagonal é maior que a soma dos 
módulos dos outros elementos que estão na mesma linha. 


2. Não vale pois M - 


é uma matriz com llMll = 1,011875 e 


4. a) 

X 4 



llx 4 - XII < 1,85 


b ) I" 2317 

1152 

X 4 = "^jf e IIX 4 - XII « 0,151 

12281 

9216 

O processo de Gauss-Seidel converge mais rapidamente que o de Jacobi. 
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CONJUNTOS CONVEXOS E 
PROGRAMAÇÃO LINEAR 


14.1 INTRODUÇÃO 

Um problema de otimização envolve maximizar ou minimizar uma função restrita 
a certas condições. Estamos sempre interessados em minimizar custos, maximizar 
lucro, rendimento etc. A programação linear é uma técnica que pemute a resolução 
destes problemas no caso específico em que as funções a serem analisadas são 
funções afins (lineares mais constante) e as restrições são dadas por desigualdades 
lineares (regiões poliedrais convexas). 

Neste capítulo, introduziremos os conjuntos convexos e analisaremos os 
máximos e mínimos que as funções afins assumem nestes conjuntos, traduziremos 
problemas concretos para esta linguagem e procuraremos resolvê-los. Isto será feito 
de uma maneira mais conceituai e geométrica nas seções 14.2 e 14.3, e de uma 
maneira algorítmica e programável na seção 14.5, escrita pelo professor Antonio 
Carlos Moretti, que vem trabalhando em muitos problemas nesta área e que nos deu 
valiosas sugestões para esta nova versão. 

Os resultados de conjuntos convexos e programação linear começaram a ser 
organizados no final do século passado e início deste século, a partir de trabalhos de 
matemáticos como H. Minkowski, A. Haar, H. Weyl. A partir dos anos 40 tivemos 


um rápido desenvolvimento dessa área, principalmente no que se refere ao 
desenvolvimento de algoritmos que permitiram programar e resolver inúmeros 
problemas aplicados envolvendo muitas variáveis. 

A grande difusão da programação linear nos últimos anos deve-se ao fato de 
que, embora ela trate de um problema específico, ela é uma técnica simples e 
muitos problemas do cotidiano podem ser formulados segundo esta linguagem. 


14.2 CONJUNTOS CONVEXOS 

As noções que introduziremos a seguir visam uma caracterização de regiões 
convexas especiais. O conceito de variedade linear de um espaço vetorial é algo que 
abrange seus subespaços e as translações destes. 

14.2.1 Definição: Um subconjunto A de um espaço vetorial V é uma 
variedade linear de V se existe um subespaço W de Ve um vetor v 0 de V 9 tal que: 

A =jvEK;v = v 0 +w para w € W | 

Usaremos a notação A = v 0 + W para indicar a variedade linear. Observe 
que se v 0 ^ 0, então A não é um subespaço. Por dimensão de A, denotada 
dim/1, entendemos a dimensão de W. 

14.2.2 Exemplos 

Exemplo 1: Um exemplo de uma variedade linear de dimensão 1 no R 2 
é uma reta (que passe ou não pela origem), como indica a Figura 14.2.1. 



Figura 14.2.1 


Biblioteca de í 
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Um ponto do plano é uma variedade linear de dimensão zero. 

Exemplo 2: Todo subespaço é, em particular, uma variedade linear 

(v 0 = 0). 

Exempb 3: Como já vimos (Exemplo 9 de 4.3.2) o conjunto-soluçao de 


2 x + 4 y + z = 
x + y + 2z = 


1 

1 


x + 3/ - 


não é um subespaço vetorial de M{ 3, 1). Resolvendo o sistema vemos que os 
vetores-solução são da forma: 



Note, ainda, que os vetores do tipo 



I cniucão do sistema homogêneo associado (Exercícios 20 e 22 da secção 
16)Tformam um Lbespaço. MQ. I), * di™nsio 1. P» rt »,o. o «»• 

junto dos vetores-solução do nosso sistema, descrito em (*)> e uma vane 

linear de dimensão 1 . 



Exemplo 4 :: De modo geral: se um sistema de equações lmeares é compa¬ 
tível (isto é, admite solução) seu conjunto-solução é tuna variedade linear de 
dimensão igual ao grau de liberdade do sistema. (Verifique isto! Compare com 
o Exercício 21 da secção 2.6.) 

No caso particular do Exemplo 4 acima em que temos apenas uma equação 
linear, a variedade linear determinada por esta equação será chamada hiperplano 
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Por exemplo, em R 3 (observe que estamos identificando M(3, 1) com R 3 ), o hi 
perplano determinado pela equação 2x + 3y + 3z - 2 = 0 é o plano 


y 


Figura 14.2.2 

No caso de R 2 , um hiperplano é uma reta (faça um exemplo). 

Um hiperplano divide o espaço vetorial em 2 semi-espaços. For exemplo, 
ao considerarmos o hiperplano em R 3 descrito por 

2x + 3>>+3z - 2 = 0 

teremos o espaço dividido em aois semi-espaços que são os pontos (x, z) que 
satisfazem 2 x + 3y + 3 z - 2 > 0 ou 2 x + 3^ + 3 z - 2 < 0 , respectivamente. 
Na figura 


X 

Figura 14.2.3 


a região hachureada representa o semi-espaço 2x + 3y + 3z - 2 < 0. 

Se considerarmos, agora, o hiperplano x + y - 1 = 0 no R" (que é uma 
reta no plano), qual é o semi-espaço descrito por x + y - 1 > 0 ? (Note que 
como aqui o espaço vetorial é o R 2 , o semi-espaço será dado geometricamente 
por um semi-plano). Para resolvermos este problema, uma vez traçado o hiper¬ 
plano (no caso a reta) x + y - 1 =0, escolhemos um ponto de R 2 , por exem¬ 
plo a origem (0, 0) e verificamos se ele satisfaz ou não a desigualdade. Neste 
caso, como para Jt = 0 , y - 0 , x + y - 1 = -1 < ri, o ponto (0, 0) não está 
no semi-espaço procurado; este será aquele que não contém a origem. 
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Figura 14,2.4 


Usa-se, ainda, aistinguir entre semi-espaço fechado (o que contém o hi- 
perplano) e semi-espaço aberto (o que não contém o hiperplano), No último 
exemplo, o semi-espaço aberto, descrito por jc + y - 1 > 0, será o semi-plano 
assinalado, excluindo-se a reta jc + y - 1 = 0. 

Para hiperplanos definidos por uma equação de mais do que três variáveis 
não teremos uma visão geométrica dos semi-espaços vetoriais como nos exem¬ 
plos anteriores, mas estes conceitos são abordados da mesma maneira: 

Hiperplano H= (x t , ...,*„)€ R" ;</,*, + ... + = è 

é uma variedade afim de dimensão n - 1 que divide o R" em dois subespaços 
fechados : 


H + = (x íf jc„)€R' i ; 0 1 x 1 + ... +a n x n >b e 
H“= (x u ... 9 x n )£R n \a l x l + ... +a n x n <b 

14.2.3 Vamos agora apresentar um problema que nos guiará nos itens a 
seguir. Suponhamos que um agricultor queira adubar a sua plantação e dispo¬ 
nha de dois tipos de adubo. O primeiro contém 3 g de fósforo, 1 g de nitrogê¬ 
nio e 8 g de potássio, e ciista 10 u.c.p. por quilograma. O segundo tipo contém 
2 g de fósforo, 3 g de nitrogênio e 2 g de potássio, e custa 8 u.c.p, por 
quilograma. Sabemos que um quilograma de adubo dá para 10m 2 de terra, e 
que o solo em que estão suas plantações necessita de pelo menos 3 g de fósfo¬ 
ro, 1,5 g de nitrogénio e 4 g de potássio a cada 10 m 2 . Quanto o agricultor de¬ 
ve comprar de cada adubo, para cada 10m 2 de terra, de modo a conseguir ter 
o mínimo custo? 





i 


Conjuntos Convexos e Programação Linear 355 



JC 

y 

Necessidades 
mínimas de adubo 

Tipo A 

Tipo B 

Fósforo 

3 

2 

3 

Nitrogênio 

i 

3 

1,5 

Potássio 

8 

2 

4 


Custo 10 u.c.p. 

H 

Custo 8 u.c.p. 



Chamemos de jc a quantidade em kg de adubo do primeiro tipo e y a do 
segundo tipo. Evidentemente, jc e y não podem assumir qualquer valor, pois de¬ 
vemos ter jc > 0 e y > 0 e, além disso, x kg do primeiro adubo fornece 3jc g 
de fósforo, enquanto que y kg do segundo tipo fornece 2y g de fósforo. Então, 
se usarmos jc kg do primeiro e y kg do segundo, estaremos adicionando 3x + 2 y 
gramas e, pela exigência mínima do solo, devemos ter 3x + 2y ** 3. 

Analogamente, para o nitrogénio e o potássio deveremos ter x + 3y > 1,5 e 
8jc + 2y > 4. Então os valores x e y devem satisfazer simultaneamente: 

(§) JC > 0, y > 0, 3jc + 2 y > 3, * + 3y > 1,5, 8* + 2>- > 4. 

Colocando num gráfico as quantidades x (como abscissa) e y (como ordenada), 
como mostra a Figura 14.2.5 observamos que estas restrições nos conduzem a: 
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Isto é, para que os valores x e y satisfaçam simultaneamente todas as desigual¬ 
dades, o ponto ( x , y) deve estar na região hachureada A. Note que esta região A 
é dada por uma intersecção de semi-espaços fechados do R 2 . 

Além disso, queremos que o custo dado pe]a função 

f(x,y)= Uk + Sy 

seja mínimo, isto é, estamos procurando na região hachureada qual é o ponto 
(x, y) no qual / (x, y) tem o menor valor. 

Para resolver este problema devemos, então, estudar um pouco mais as 
propriedades dos conjuntos do tipo de A e das funções do tipo f(x, y). Para 
isto precisamos das definições dadas a seguir. 

14.2.4 Definição: Sejam A e B dois pontos do R". O segmento de extre¬ 
mos A e B é o conjunto ÃB de pontos R*, dado por: 

ÃB - {(1 - t )A + rB; 0 < t < 1} 

Esta definição corresponde exatamente à nossa intuição de segmento em 
dimensão dois e três. 

Observe que no segmento AB o ponto que corresponde a t - 0 é o pon¬ 
to A, o ponto que corresponde a t = 1 é B e, a qualquer ponto P do segmen¬ 
to, existe ti E R tal que 0 < < 1 e P = (1 - / t )A + /jB. Tomemos, por 

exemplo, A = (1, 2) e B = (3, -1) em R 2 . Dado o ponto P = (2, 0) sobre o 
segmento, podemos escrever ( 2 , 0 ) = (1 - |)( 1 , 2 ) + j ( 3 , - 1 ), ou seja, 

existe / = - (0 < t < 1 ), tal que P = (1 - r)A + tB. Por outro lado, se to¬ 
mamos fj, tal que 0 ^ t\ ^ 1, por exemplo t l = 2 , e fazemos 

Pi = (1 - + tjB = (2, -1), verificamos facilmente que P, está sobre o seg¬ 

mento AB. 


Figura 14.2.6 


14.2.5 Definição: Um subconjunto S do R” é chamado convexo se para 
quaisquer dois pontos A e B de S o segmento AB está inteiramente contido 
em S. 
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14.2.6 Teorema: Um semi-espaço fechado é convexo. 

Prova : Mostremos isso no caso de R 2 . (O caso geral é feito, usando o mesmo 
argumento.) No caso de R 2 , um semi-espaço fechado é constituído por pontos 
(*, y), que satisfazem uma expressão do tipo ax + by + c < 0 . 

Precisamos mostrar que se tomarmos dois pontos quaisquer do semi-espaço, o 
segmento que une estes pontos está contido no semi-espaço. Sejam A =(x 0 , y 0 ) 
e B - (*i, y\) dois pontos quaisquer do semi-espaço, e seja P um ponto qual¬ 
quer de AB. Existe, então, t x G R, com 0 < t x < 1, tal que 

P = (1 - 'i)(*o, yo) + h{x u y { ) 

((1 “ ) *0 + (l“^l)yo + ^l^l) 

e temos que verificar se: 

(*) 4 0 + 'i*i] + b[(\ -t x )y Q + t x y x ] + c < 0, 

que é a condição para P estar no semi-espaço. Mas 

4(1 - 1 1 )* 0 + ^[(1 - t x )y Q + t x y x ] + c = 

- (1 - + t x ax v + (1 - t x )by Q + t 1 by 1 + (1 - 1 t )c + t x c 

= (1 - t x )[ax 0 + by 0 + c] + t x [ax x + by x + c], 

e como ax 0 + by 0 + c < 0 e ax x + by x + c < 0 (pois A e B estão no semi- 
espaço) e 1 - t x > 0 e t x > 0 (pois 0 < t x < 1), a relação (*) é satisfeita. 
Assim, como P está no semi-espaço e P era um ponto arbitrário de AB, então 
o segmento AB está inteiramente contido no semi-espaço e, portanto, este é 
convexo. 

14.2.7 Teorema: A intersecção de conjuntos convexos é um conjunto 
convexo. 

Prova: Sejam ^ e 5 2 dois conjuntos convexos. Precisamos mostrar que se A e 
B são dois pontos quaisquer de S x n S 2 , então AB C 5, O S 2 . 

Mas se A, B G S x O S 2y então A, B G S x e como S x é convexo, AB G S x . 
Analogamente, se A, B G S x n S 2 , então A, B G S 2 e como S 2 é convexo, 

AB G S 2 . Como AB está contido simultaneamente em S x e S 2 , então 
ÃB e S x D S 2 ‘ Portanto S x O S 2 é convexo. 

14.2.8 Definição: Uma região poliedral convexa fechada em R n é uma 
intersecção de uma quantidade finita de semi-espaços fechados do R". 

Devido aos dois teoremas anteriores, uma região poliedral convexa é um 
conjunto convexo. 

14.2.9 Um conjunto A C R n é dito limitado se existirem constantes 

k-, i=l, n tais que, se (x lt x n )GA então x ( * = ]. n 



14.2.10 Exemplos 

Exemplo I : 





Figura 14.2.8 


Note que da maneira como foi definida uma região poliedral convexa 
fechada é sempre obtida por um sistema de desigualdades lineares (uma 
desigualdade para cada semi-espaço). Como exemplo veja (§) de 14.2.3 
e Figura 14.2.5. 

Numa região poliedral convexa, procuramos pontos especiais - os vértices. 

Na região poliedral convexa do exemplo 14.2.3, eles são os pontos 

Pj — (0, 2), P 2 = ( j , f ), P 3 = ( 4 * f* ) e P 4 = (y , 0). Note que estes pontos 

são dados por intersecção de duas das retas que definem os semi-espaços. Assim, por 
exemplo, P 2 é dado pela solução do sistema 
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í 3x + 2y - 3 = 0 
\ 8 x + 2y -4 = 0 

Note, porém, que o ponto (0,-f ) que é solução do sistema 

í 3x + 2y-3 = 0 
\ x = 0 

não pertence à região A. 

Este comentário nos leva a: 

14 2 11 Definição: Dada uma região poliedral convexa fechada do R (de 
terminada por um sistema de inequações lineares), os vértices dessa região sao 
os pontos da região que satisfazem um dos possíveis sistemas de n equações 
lineares independentes, obtidas substituindo-se as desigualdades por igualdades. 

Observação: Depois de resolver um sistema, a fim de verificar se o 
ponto está na região, testamos para ver se ele satisfaz todas as desigua a e . 

14.2.12 Caracterização Geométrica dos Vértices: Os vértices que aqui f° ra * n 
definidos “algebricamente” são os pontos extremos da região poliedral convexa . 
C„m 1.0 queremos diee, ,u, eles slo os pon.os d, *» «-£ no 

“interior” de nenhum segmento contido na região. Mais form 
de R se, e somente se, P está num segmento AB contido em R então 
ou P = B”. Prove este fato! Sugestão: Se P 6 R” satisfaz uma igualdade 
a x +... + a x + b = 0 (hiperplano), então p + n e p - v satisfazem 

adesigualdade correspondente se,e somente se, vsatisfaz a ‘ê uaWade 

fllXl + ... + a n x n = 0 (lembre-se depois disto que a umca solução de um sistema 

homogêneo de n-equações LI é o vetor nulo). 

14.2.13 Exemplo 1 : A região A do problema 14.2.3 é descrita pelas 
desigualdades ^ ^ 

y> 0 
3x + 2y > 3 
* + 3 }> > 1,5 
&t + 2y > 4 

Ao substituirmos por igualdades e tomarmos os sistemas de duas equações 
obtemos 10 = (4-). Dentre estes, determinaremos os vértices, verificando quais 
satisfazem o sistema de inequações que definem a região A. Neste caso, teremos 
apenas os pontos Pi,P 2 >P 3 ^P 4 nestas condições. Veri ique. 
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Exemplo 2: Consideremos a região poliedral convexa fechada de R 3 , dada 
pelo sistema de inequações lineares 

* + y + z < 3 

I y- z <2 
1 * - 2 y <1 

* > 0 

Então os possíveis vértices sao dados pelos sistemas de três equações 
r X + > + z = 3 

y " 2 = 2 => (3, 1 , - 1 ) (está na região, pois satisfaz todas as ine- 

x 2y = 1 quações) 

r y-z= 2 

\ x ■ 2y = 1 => ( 0 , ) (está na região) 

l* =0 

"x + j + z = 3 

* y “ z = 2 => ( 0 , |) (está na região) 

= 0 

f x + y + z = 3 i 

x - 2y =1 ^ ^° 5 ~Y » y) ( está na re g iã0 ) 

* =0 

E a região é 
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Agora, estamos em condições de caracterizar problemas como o introduzido 
em 14.2.3 e que podem ser resolvidos pela técnica específica que é a programação 
linear. 


14.3 INTRODUÇÃO A PROGRAMAÇÃO LINEAR (PL) 

A programação linear trata do problema específico de: 

Maximizar ou minimizar uma função do tipo 

f(Xi, ->X n ) = a i x i + - + a n x n +b > 

restrita a um subconjunto A poliedral convexo de R n . 

(Note que f :R n -> R é uma transformação afim, isto é, 
f(x) = L (jc) + b onde L é uma transformação linear, b £ R.) 

Na linguagem de programação linear (PL),/é chamada função objetivo 
(f.o.) e A é denominada região factível 

No exemplo da seção 14.2.3, f.o. é dada por f(x, y) = IO* + Sy 
e a região factível é a região A descrita por: 

1 x>0 

y> 0 
3jc + 2y > 3 
x + 3y > 1,5 
8 x + 2>> > 4 

Nosso problema é minimizar / restrita a A . 

14.3.1 Método Geométrico 

Vamos (finalmente!) resolver o problema proposto em 14.2.3. 0 
procedimento que vamos seguir é conhecido como método geométrico de 
resolução em PL. 

Vamos reescrever a f.o. acima, utilizando produto interno do R 2 . 

f(x, y) = < ( 10 , 8 ), (jc, >, c = ( 10 , 8 ) é denominado vetor gradiente 
e x = (*,>>). 

Observação 1 : fé constante nas retas perpendiculares ao vetor c = (10, 8 ). 

De fato: 

Uma reta perpendicular a c pode ser escrita na forma paramétrica do 
seguinte modo: 



(x, y) = (x*,y*) + \(-&, 10) 
ou seja x = x* + Xc 1 

onde x* = (x*. y*) é o vetor deslocamento, que podemos tomar na direção de c. 

Portanto,/(x, y) = (c, x> = (c, x* + Xc A > = <c, x*>= c • x* cosae,neste 
caso, cos a = 1. 

Observação 2: Da observação 1 você pode notar que / será tão menor quanto 
menor for o deslocamento x* , ou seja, f(x y y) assume seu mínimo no ponto 
(ou pontos) da região factível que estiver na reta perpendicular a c, mais próximo 
da origem. Em nosso problema, o ponto é (— , —) = P 3 que é um vértice da 
região factível. 7 14 

14.3.2 Exemplo : Uma fábrica produz dois tipos de geradores, tipo A e tipo B, 
e cada um deles deve passar por duas máquinas, C e D. Para fazer um gerador 
do tipo A, a máquina C deve trabalhar 2 horas e a máquina D deve trabalhar 
4 horas. Para fazer uma unidade do tipo B, as máquinas C e D devem trabalhar 
respectivamente, 4 e 2 horas. As máquinas podem trabalhar 24 horas por dia. 
Sabe-se que a fábrica tem um lucro de 3.000 u.c.p. por um gerador do tipo A 
e um lucro de 5.000 u.c.p, por um do tipo B. Além disso, ela vende toda 
a sua produção. Sendo assim perguntamos: quantos geradores de cada tipo a 
fábrica deve produzir, para que seu lucro seja máximo? 
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Chamemos x a quantidade do tipo A e y a do tipo B, e observemos as 
restrições sobre x e y. Se são fabricados x geradores do tipo A, o tempo gasto 
peta máquina C é 2x, e se são fabricados y geradores do tipo B, o tempo gas¬ 
to pela máquina C é 4 y, ou seja, o tempo total usado pela máquina C é 
2x + 4>\ que deve ser menor que 24 horas. Analogamente, temos uma restri¬ 
ção para a máquina D. Devemos ter, então: 

x> 0 
y > 0 

2x + 4y < 24 
4* + 2 y < 24 

que nos fornece a região mostrada na Figura 14.3.11, cujos vértices são (0,0), 

(6, 0), (4, 4) e (0, 6). A função que queremos maximizar é a função lucro. 



/(*, y) = 3 000* + 5000}' 


Use o método geométrico descrito no exemplo anterior para determinar 
o máximo de /, observando que, para obter o máximo, você deve “caminhar” na 
região por retas perpendiculares ao vetor gradiente da f.o. e no mesmo sentido dele. 


14.3.3 Tipos de Solução 

Baseado no método geométrico que descrevemos na seção anterior, já se pode 
intuir vários tipos de solução de problemas de programação linear de duas variáveis. 
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Vamos considerar todos os tipos possíveis de regiões poliedrais convexas no 
R 2 e pesquisar os máximos e mínimos de uma função /(*, y) = ax + by + c. 

Na Figura 14.3.12 tomamos a - 1 e b = 2. 

(a) Regiões ilimitadas sem vértices 




(b) Regiões ilimitadas com vértices 
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Podemos observar portanto que a função 

f (x,y) = x+ 2y + c na região 

Ri assume mínimo em toda reta ("fronteira" de R x ) e não assume máximo. 

R 2 não assume máximo nem mínimo. 

R 3 não assume máximo nem mínimo. 

R a assume mínimo nos vértices A e B , portanto assume mínimo em todo 
segmento AB, e não assume máximo. 

R s assume mínimo no vértice A e máximo no vértice C. 

R 6 não assume máximo nem mínimo. 

R 7 assume máximo no vértice A e não assume mínimo. 

R & assume mínimo no vértice B e máximo no vértice A. 

R 9 tem o vaJor máximo igual ao valor mínimo e igual a f (A), 

Exercício:a) Descreva, através de inequações, as regiões R lf R 2 ,..., R 9 
acima. 

b) Faça um estudo semelhante ao que foi feito acima para determinar 
os máximos e mínimos de/(x, >>) =- 2x + y + c nas regiões R lt R 2 , mm .,R q . 


14.3.4 Resolução do Problema para n-varíáveis 

Podemos estender o método geométrico descrito no Exemplo 14.3.1 para 
problemas de PL em geral. Teremos então para f(x lr x rt ) = a x Xi + ... + 

+ a n x n + b o vetor gradiente c = (<z lf a 2f ..., a n )E R*. Em termos de produto 
interno temos/(x) = <x, c> + b, x = (x { ,.. A função objetivo será, portanto, 
constante nos hiperplanos perpendiculares a c. (Para as noções de perpendicularismo e 
co-seno do ângulo entre vetores do R n , consulte, se necessário, o Capítulo 8.) 

No caso de problema envolvendo três variáveis ainda é possível visualizar 
geometricamente. Os pontos de mínimo ou máximo da f.o. serão procurados 
varrendo-se a região factível por planos perpendiculares ao vetor gradiente 
c = (a,,a 2 . fl 3 )e R 3 . 

Exercício: Para fixar melhor este procedimento, considere a função 
f(x, y, z) = 4 - x - 2y + z- Determine o valor máximo e o valor mínimo que 
/assume na região descrita no Exemplo 2 de 14,2.13. Observe os pontos onde 
isto ocorre. 

Fica difícil, trabalhar na prática com este procedimento geométrico para 
quatro ou mais variáveis. Mas esta noção de procurar máximos e mínimos da função 
objetivo por uma varredura de hiperplanos perpendiculares ao gradiente nos 
permite intuir dois fatos cruciais na programação linear. 
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i) A função objetivo assume necessariamente um valor máximo e um valor mínimo 
quando a região poliedral convexa (factível) for limitada. 

ii) Os vértices desempenham um papel fundamental na procura de máximos e mínimos 
para a função objetivo . 

Volte aos exemplos anteriores de PL, tente observar o porquê deste fato. 

Na próxima seção vamos formalizar esta última observação, estabelecendo o 
resultado que é fundamental na resolução de problemas de PL. 

14.3.5 Teorema Fundamental da Programação Linear 

0 primeiro resultado nos diz que os valores extremos de uma função afim 
são assumidos nos pontos extremos dos segmentos. 

Lema l :Se]af(x lLi: . t x n )^a x x x +a 2 x 2 + -+a n x n e seja P um ponto 
interior a um segmento AB do R n , isto é, P = X A + (1 - X) B, 0 < X < 1. 

Então teremos/(A) </(P)</(B) ou /(B) </(P)</(A). 

Prova : Como P = XA+(l-X)Be fé uma transformação afim, 

/(x) = /(x)+ b , ondeL (x)-L (x u ...,x n ) = a l x l +a 2 x 2 + ... +a n x n é linear, 
/(P) = L(P) + *=L(XA+(1 -X) B) + b = \L( A)+ (l-X)i(B) + 6 . 

Suponha / (A) </(B) => L (A) < L (B) 

Como /(P) = X L (A) + (1 - X) L (B) + b temos 

\L (A) + (1 - X) L (A) + b </(P) < X L (B) + (1 - X) L (B) + b. 

L(A) + b<f(P)<L(h) + b 

Portanto: 

/(A)</(P)</(B) 

Da mesma forma, se tivermos/(B) </(A) mostramos que /(B) </(P) </(A). 

Uma conseqüência deste resultado é o lema a seguir, que você poderá provar 
como exercício. 

Lema 2: Seja f(x lt x n ) = a l x í + a 2 x 2 + ... + a n x n + b. Se dentre os 
valores que f assumir num segmento AB do R", o valor máximo (mínimo) for 
assumido num ponto P interior deste segmento, então/será constante em AB. 

Analisando os enunciados dos lemas 1 e 2 e a natureza de uma região 
poliedral convexa, estamos em condição de enunciar o principal resultado da PL. 
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Teorema Fundamental da Programação Linear 

Seja/(*i,.x rt ) = a í x l + ... +a n x n +6 definida numa região poliedral 
convexa.4 do R n . Suponha que/assuma um valor máximo (mínimo) nesta 
região. Então, se A possui vértice(s), este valor máximo (mínimo) será assumido 
num vértice. 

Prova: (Para regiões A do R 2 .) Suponhamos que o valor máximo (mínimo) 
de /seja assumido num ponto P de A . 

Considerando todas as regiões poliedrais convexas possíveis do R 2 (veja 
14.3.3), podemos ter: 

/) P é um vértice . (Neste caso o teorema já estará provado.) 

ii) P está numa aresta. Do lema 2, /assumira este valor máximo (mínimo) 
em toda aresta. Como a região A possui vértice (s) esta aresta conterá 
um vértice v obrigatoriamente. (Por quê?) Portanto, /(P) = /(v). 

iii) P está no interior de A. Neste caso,/será constante em toda região A. 

De fato: 


Figura 14.4.12 

Seja Q um outro ponto interior de A . Como A é poliedral convexa, o 
segmento QP está contido em A ; além disso, como P é interior, podemos 
considerar um prolongamento Q Q deste ainda contido em A. Do lema 2 segue 
que/é constante em QQ * e, portanto, /(P) =/(Q). 

Observação 1 : A prova deste teorema para «-variáveis vai envolver um número maior 
de possibilidades: o ponto inicial de máximo (mínimo) poderá estar 

i) num vértice; 

ii) numa aresta (solução de (n - 1 ) - equações). Neste caso, o máximo (mínimo) 
será assumido em toda a aresta que é um subconjunto de dimensão 1 ; 
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///) numa face (solução de (n - 2) - equações). Neste caso, o máximo (mínimo será 
assumido em toda a face que é um subconjunto de dimensão 2 ; 

ni) num ponto interior da região A (que tem dimensão n). Neste caso, a função será 
constante em toda região. 

Pode-se mostrar que em todos estes casos, quando a região tem vértices, 
conseguimos um vértice v onde a função assume seu máximo (mínimo), 

/(v) = /(P). 

Observação 2; É este teorema que permite, nos casos em que, pela natureza da 
função, já sabemos que ela assume máximo (mínimo) encontrá-lo apenas 
determinando seus valores nos vértices da região poliedral convexa. 

Exemplo: No problema proposto na seção 14.2.3 : temos 
f{x, y) = lGx + Sy > 0 pois* > 0 ty > 0. 

/é, portanto, limitada inferiormente, o que nos permite concluir que ela assumirá 
um mínimo na região que é fechada. Para encontrá-lo, bastará portanto calcular 
o valor da função nos vértices da região. 

Regiões Limitadas 

Uma situação onde, para qualquer função objetivo, temos necessariamente 
máximo e mínimo acontece quando a região A for limitada. Para mostrar este fato, 
você deve voltar para a solução geométrica dos problemas de PL (14.3). Note que, 
ao varrermos o R* por hiperplanos perpendiculares ao vetor gradiente da f.o., 
sempre tocaremos a região A uma primeira e uma última vez. Além disto, uma 
região poliedral convexa limitada claramente possui vértices (por quê?). Isto nos 
permite reescrever o teorema fundamental PL para este caso. 

Teorema: Seja f(x Í9 x 29 ...,x n ) = a l x l + .. +a n x n +b defmida numa região 
poliedral convexa limitada A. Então/ assume seus valores máximo e mínimo nos 
vértices de A. 

Algoritmos para Resolver Problemas de PL 

Vimos nesta seção que grande parte dos problemas de programação linear se 
resolve analisando-se apenas os valores da função objetivo nos vértices da região 
factível. Tanto a determinação dos vértices (resolução de sistemas lineares) quanto 
o cálculo da f.o. nestes são possíveis de algoritmos e de programação para 
calculadoras, microcomputadores e computadores. Na próxima seção introduziremos 
um destes métodos, conhecido por método simplex. 



Programação Linear Inteira 

Muitos problemas práticos podem ser formulados como maximizar ou 
minimizar uma função do tipo f(x ít x„) -a l x l + ... + a n x n + b numa região 
poliedral convexa, com a restrição adicional que as variáveis são inteiros . Este é 
o caso por exemplo do problema proposto em 14.3.2. 

Na resolução de um problema de PL, nem sempre o máximo ou mínimo 
ocorrem em pontos cujas coordenadas são números inteiros, condição indispensável 
na formulação de certos problemas. Existem técnicas para se determinar soluções 
inteiras ótimas (máximo ou mínimo), isto é, soluções mais próximas dos vértices 
de máximo ou mínimo. Em alguns problemas você poderá fazer isto intuitivamente, 
veja Exercício 16 de 14.4. No caso geral, estes problemas são tratados na subárea 
de PL denominada Programação Linear Inteira (veja referências ao final do capítulo) 

* 14.4 EXERCÍCIOS 

1. Na definição de variedade linear em 14.2.1 prove que v 0 € A. O vetor v 0 é 
único? W é único? Interprete geometricamente. 

2. Desenhe a região em R 2 , definida pelas desigualdades 

2x + y + 9 > 0 
i -* + 3y + 6 > 0 
x + 2 y - 3 < 0 

Quais são seus vértices? 

3. Desenhe a região definida em R 3 , pelas desigualdades anteriores. 

4. Quais são os vértices da região poliedral convexa em R 2 , definida por 

x >0 
2x + 3y < 2 
’ 3x + 2y « 2 
x + y < 1 

Desenhe esta região. 

5. Se duas regiões poliedrais convexas são definidas por dois conjuntos de desi¬ 
gualdades lineares, a intersecção destas regiões é definida por qual conjunto 
de desigualdades? 

6 . A união de dois conjuntos convexos é convexa? 
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7. Sejam A = ( 1 , 2 , 3) e B = (0, 1, - 1 ) dois pontos de R 3 . O ponto (0, 0, 0) 
está sobre o segmento AB? 

8 . Uma região poliedral convexa fechada de R 2 tem vértices (-2, 0), (3, 4), 

(1, 0) e (-1, -1), Ache um conjunto de desigualdades que defina esta região. 

9. Ache os pontos de máximo e os pontos de mínimo da função /(*, y) = 

= lx + 5y + 2 definida na região determinada pelas desigualdades 

2x + y + 9 > 0 
-x + 2 y + 6 > 0 
" x>0 

x + y - 4 < 0 

10. Uma máquina produz dois tipos A e B de frascos de vidro, mas não simul¬ 
taneamente. Ao produzir um frasco do tipo A ela gasta 0,2 horas, e ao pro¬ 
duzir um tipo B, gasta 0,4 horas. Sabendo que a máquina pode trabalhar 

no máximo 16 horas por dia e que o fabricante tem um lucro de 2 u.c.p. 
com um frasco tipo A e 3 u.c.p. com um frasco tipo B, quantos frascos 
de cada tipo devem ser produzidos para que o lucro seja máximo? 

11. Uma companhia de transportes dispõe de 4 caminhões com capacidade para 
transportar 5.000kg, 4 caminhões de 10.000kg de capacidade e 2 caminhões 
de 20.000 kg de capacidade. O custo por hora dos caminhões do primeiro 
tipo é 200 u.c.p., do segundo 300 u.c.p. e do terceiro 400 u.c.p. Como 

devem ser usados os caminhões para transportar uma carga de 80.000 kg, 
para que o custo seja mínimo? 

12 . Uma indústria produz porcas, parafusos e pregos, podendo usar dois métodos 
distintos (mas não simultaneamente) para produzi-los. O primeiro método pro¬ 
duz 3.000 porcas, 2.000 parafusos e 2.500 pregos por hora, enquanto o se¬ 
gundo produz 4.000 parafusos e 4.000 pregos por hora, mas nenhuma porca. 
A indústria trabalha 18 horas por dia e tem uma encomenda de 5.000 por¬ 
cas, 5.000 parafusos e 5.000 pregos. Durante quantas horas ela deve empre¬ 
gar cada método para fazer a entrega o mais rapidamente possível? 

13. Seja f(x, y) = 3x + 3y definida na região poliedral convexa abaixo: 

a) Qual o valor máximo e mínimo de /? 

b) Calcule os valores /(A), /(B) e /(P), onde P é um ponto no segmento AB. 

c) Use (a) e (b) para determinar os pontos onde f atinge o máximo e os 
pontos onde assume o mínimo. 



Figura 14.4.13 


14. Numa indústria química há uma caldeira cuja margem de segurança é tal que 

a pressão P medida em atmosferas, e a temperatura T, medida em graus Celsius, 
devem ser reguladas de maneira que 10 P + T < 400. Quer-se usar a caldeira 
para que seja processada uma determinada reação. Para que isto ocorra da 
forma desejada, a temperatura deve estar entre 80°C e 300°C, e a pressão entre 
1 e 20 atmosferas. A que temperatura e pressão deve trabalhar a caldeira para 
que a reação se processe no menor tempo possível, se sabemos que a 
velocidade da reação é dada por v — 27’+30/ > + 20 ? 

15. Mostre que uma região poliedral convexa limitada .4 do R 3 pode ser 
caracterizada pelos seus vértices v lf ..., v n da seguinte maneira: 

A = j x £ R 3 ; x = Vi + ... + 0 < X z - < 1, / = 1 ,n | 

16. Construção de Casas Populares. (Problema coletado pelo Prof. Rodney 
Bassanezzi em Guarapuava-PR.) 


Tipo de Casa 

A 

B 

C 

Número de pessoas 
que abriga 

6 

4 

3 

Custo de construção 
(em UPC) 

1.200 

1.000 

800 

Demanda 

(n Q de famílias que solicitaram) 

150 

200 

250 
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Verba total disponível: 2.000.000 UPC. 


14.5.2 Exemplo do Fabricante de Móveis 


a) Determine quantas casas de cada tipo devem ser construídas de modo a 
atender o maior número de pessoas possível. 

b) Resolva o item à) supondo que o custo da casa do tipo B passou para 
1.040 UPC. 

c) Estabeleça um critério que leve em conta o número de pessoas e o 
número de famílias que solicitaram as casas. Determine o número de 
casas de cada tipo a serem construídas de modo a otimizar o critério 
que você adotou. 


14.5 MÉTODO SIMPLEX 

14.5.1 Introdução 

O método gráfico apresentado na seção anterior é utilizado apenas para 
problemas com duas ou três variáveis. Para problemas maiores, o método gráfico 
toma-se impraticável, neste caso nós precisamos de uma técnica eficiente para 
resolver problemas de programação linear com mais de três variáveis. Esta técnica 
é o método simplex, 

O método simplex nada mais é do que um algoritmo de busca, isto é, ele 
começa num vértice da região factível e move-se de um vértice factível a outro até 
encontrar o vértice ótimo. Foi desenvolvido em 1947 por George B. Dantzig, e após 
sua concepção houve um crescimento espantoso da programação linear, com 
centenas de livros e artigos publicados nos círculos acadêmicos. Antes de 1947, 
a programação linear era praticamente desconhecida, havendo, entretanto, algumas 
exceções, por exemplo, Fourier (1823), de la Poussin (1911), Kantorovich (1939). 

A pouca utilização da programação linear antes de 1947 era devida à grande 
dificuldade computacional de se resolver problemas lineares, pelo fato de existir 
um grande número de combinações (factíveis e não-factíveis) a serem pesquisadas. 
Com o método simplex essa dificuldade foi otimizada, pois o algoritmo simplex 
realiza uma busca apenas nos vértices factíveis (que pertencem à região factível). 

Nesta seção, introdüzi remos o método simplex através da resolução de um 
modelo simples de programação linear. Uma visão algébrica do método simplex 
também será apresentada, para que o leitor verifique que atrás do "procedimento 
mecânico'* do método simplex existe toda uma base algébrica. Por último, será 
apresentado um programa na linguagem Basic que resolve problemas de 
programação linear e pode facilmente ser implementado em qualquer 
microcomputador existente no mercado. 



Problema: Vamos considerar um fabricante de móveis que fabrica apenas 
mesas e cadeiras. Ele tem um lucro 1 de Cr$4.500,00 em cada cadeira e de 
Cr$8.000,00 em cada mesa vendida. Supõe-se que devido à forte demanda desses 
itens consegue-se vender toda a produção da fábrica. Mas, a produção da firma 
é limitada em dois aspectos: 

1 ) Cada cadeira produzida utiliza 5 unidades de jacarandá. Da mesma forma, cada 
mesa de jacarandá produzida utiliza 20 unidades de jacarandá. Dispomos de 
um total de 400 unidades de jacarandá. 

2 ) Cada cadeira produzida gasta 10 homens-horas e cada mesa produzida gasta 
15 homens-horas. Dispomos de um total de 450 homens-horas. 

O objetivo do fabricante é descobrir qual a quantidade ótima de cadeiras 
e mesas a serem fabricadas, de tal modo que o lucro total seja o maior possível. 


14.5.3 Modelando o Problema Matematicamente 

Em primeiro lugar vamos identificar as variáveis do modelo. Vamos 
chamar de 

x 1 = número total de cadeiras fabricadas; e de 

x 2 = número total de mesas fabricadas. 

Uma vez identificadas as nossas variáveis (na terminologia de programação 
linear chamadas de variáveis de decisão), fica fácil estabelecer o modelo 
matemático do problema do fabricante de móveis. 

O lucro do fabricante pode ser expresso da seguinte maneira: 

L = 4.50(1*! + 8.000x 2 
e as restrições do problema: 

5*i + 20*2 <400 (restrição de disponibilidade da matéria-prima) 

10*! + 15*2 <450 (restrição de disponibilidade de mão-de-obra) 

Xl í n / (funções de nâo-negatividade) 

*2 ^ 0 ) 


1 Lucro é definido como o pieço de venda menos o custo de fabricação. 
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E assim, o modelo de programação linear do problema do fabricante de 
móveis pode ser estabelecido formalmente da seguinte maneira: 

Max L = 4.500JC, + 8.00Qx 2 

s/a 5xj + 2Qx 2 <400(/?i) 

10*j + 15 x 2 <450 (R 2 ) 

*1 >0 (R 3 ) 

X 2 ^ 0 (i? 4 ) 

14.5.4 Solução Geométrica 

Desenhando as restrições descritas na seção 14.5.3 obtemos a seguinte 
região factível: 



Portanto, utilizando o método gráfico verificamos que o vértice C é o vértice 
ótimo e corresponde à fabricação de 24 cadeiras e 14 mesas com um lucro de 
24 • 4.500 + 14 • 8.000 = Cr$ 220.000,00 

14.5.5 Forma Padrão do Problema do Fabricante de Móveis 

Como foi visto nas seções anteriores, a solução ótima para qualquer 
problema de programação linear ocorre num dos vértices da região factível. 

Esses vértices ocorrem onde retas se cruzam. Portanto, antes de resolver um 
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problema de programação linear pelo método simplex, devemos transformar o 
sistema de inequações linares, geradas pelas restrições do problema, em um sistema 
de equações lineares, ou seja, devemos transformar o problema de programação 
linear original na forma padrão. 

Problema do fabricante de móveis: 


MaxZ, = 

= 4.500*! 

+ 8 

b 

o 

ff 


s/a 

5*i 

+ 

20*2 

<400 


IO*, 

+ 

15*2 

<450 





>0 




*2 

>0 


Nós devemos transformar a inequação 5*! + 20x 2 < 400 em equação, para 
isto basta associar uma variável x 3 , que é chamada de variável de folga, na inequação: 

5*i + 2 Qx 2 + *3 = 400 

Usando o mesmo raciocínio para a 2? restrição, obtemos: 

10*! + 15*2 + *4 =450 

Logo, o problema na forma padrão fica: 

Max L = 4.500*i + 8.000 * 2 
s/a 5*! + 20*2 + -*3 = 400 

10*!+ 15*2 +* 4 =450 

* 1 ,* 2 »* 3>*4 >0 


14.5.6 Algumas Definições 

Considere o seguinte sistema linear: 

+ 0 i 2*2 + ■■ + 0 i n x n = ^i 
021*1 + 022*2 + * ■ + a 2n x n ~ t>2 

a m\ x i + 0 m 2*2 + ’ +a mn x n ~ 
que escrito na forma matricial toma-se 

Ax = b 

Suponha que o posto de A seja igual a me que n > m. 
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a) Solução Básica 

Dado um conjunto de m equações lineares com m incógnitas, conforme 
definido em (T) , vamos chamar de B qualquer submatriz mX m, não-singular, 
formada por m colunas independentes de A (se A tem posto igual a m então tal 
submatriz existe. Por quê? Veja 3.7.1), e seja N a submatriz mX (n - m) formada 
pelas n — m colunas restantes (aquelas que não pertencem a B). Portanto, 

Ax = b pode ser escrito da seguinte maneira: 

Bx B + Nx n = b 

pois A foi particionada em B e N (A = [B, N]) e x em x R e x N 
(x - [x R , x^ ]), onde x fi = [vetor de m componentes formado pelas variáveis 
associadas às colunas de B] e x N = [vetor de (w — m) componentes formado 
pelas variáveis associadas a N]. 

Então, se todos os componentes de x N forem fixos iguais a zero, a solução 
para o conjunto resultante, BXg = b, é dito ser uma solução básica para (T) com 
respeito à base B. Os componentes de x B são chamados de variáveis básicas e os 
componentes de x N de variáveis não-básicas. 

b) Solução Básica Degenerada 

Se uma ou mais variáveis básicas em uma solução básica tem valor zero, 
esta solução é dita ser solução básica degenerada. Do ponto de vista geométrico, 
isto ocorre quando temos um vértice determinado pela intersecção de mais 
de duas retas. 

Vamos considerar agora o seguinte sistema 

Ax = b 
x > 0 

o qual representa as restrições de um problema de programação linear na 
forma padrão. 

c) Solução Factível 

Um vetor x satisfazendo todas as restrições de(TJ)é dito ser factível para este 
sistema. Uma solução factível para (fi) que também é básica é chamada de 
solução básica factível. Se esta solução também for uma solução básica degenerada, 
ela será chamada de solução básica factível degenerada. 

Considere agora o problema de programação linear na forma padrão: 

Min cx 

s/a Ax = b (nj) 
x >0 
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d) Solução Básica Factível Ótima 

a solução básica factível que dentre todas as soluções básicas factíveis 
de (ill) nos dá o valor ótimo (no caso, o valor mínimo) para a função objetivo. 

Teorema Fundamentai da Programação Linear 

Dado um problema de programação linear na forma padrão (Hl) onde A 
é uma matriz m X (n + m) de posto m , 

/) se há uma solução factível, há uma solução básica factível; 

ii) se há uma solução factível ótima, há uma solução básica factível ótima. 

Do teorema anterior e da equivalência entre solução básica factível e vértice 
temos que o método simplex é finito, pois um sistema linear de m equações com 
(n + m) incógnitas tem no máximo 


soluções básicas 


Logo, o método simplex efetua um número menor que ^ j 

iterações para encontrar a solução ótima, pois o algoritmo simplex é um 
procedimento de busca, isto é, move-se de vértice factível em vértice factível, 
ou seja, de solução básica factível em solução básica factível até encontrar o ótimo. 

Considere agora o problema do fabricante de móveis na forma padrão 
conforme estabelecido na seção 14.5.5 e sua resolução geométrica na seção 14.5.4. 
Temos que 


5 20 

10 15 


1 0 
0 1 


c= [4.500, 8.000,0, 0] 

X-[Xi,X 2 ,X 3 ,X li ] T 

b = [400, 450] r 


São soluções básicas: 

1) O ponto A 

Neste caso, a base B é formada pelas colunas de x 3 e jc 4 na matriz A. 
Portanto, 

‘ 1 0 " 

B, = 

0 1 
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e x B = vetor das variáveis básicas = [x 3 x 4 ] 

o.. f 1 °lf*3 


BlX Bi 


= b => 


10 1 *4 


=► x Bl = [ x 3 *4] =[400 450] 

Fixando x, -x 2 = 0 temos que a solução basica associada à base 
Bi é x = (x,, x 2 , * 3 » * 4 ) = (0, 0,400, 450) 

2) O ponto B 

_ Í20 0 1 


Tomando a base B, 


B 2 x r =b 


21 1 


. X B = (*2.*4) 


20 0 I x 


15 1 x 4 


X B = ( X 2 .* 4 ) = (20 150) 

Portanto, fixando x t = x 3 = 0 temos que a solução básica associada 
à base B 2 é x = (x,, x 2 . x 3 , x 4 ) = (0, 20, 0,150). 

3) O ponto C 

r - 5 20 

3 ~ LlO ísj • X B = <*»’ Jt *) = < 24 - 14 ) 

À solução básica associada à base B 3 é 

x=(x lf x 2 f JC 3f X 4 )=(24, 14, 0 , 0 ) 

4) O ponto D 

® 4 = jq q , X P . =(*1,*3)=(45,175) 


A solução básica associada à base B 4 é 
x =(*i, x 2 ,x 3 ,x 4 ) = ( 45 , 0 , 175 , 0 ) 


5) O ponto E 

b 3 = [ 20 f 

15 0 


, x p = (x 2 , x 3 ) = (30, — 200) 


A solução básica associada à base B s é 
x = (x,, x 2 , x } , x A ) = (0, 30,-200, 0) 


6 ) O ponto F 

[ 5 0 


, x r = (X|, x 4 ) = (80, -350) 
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A solução básica associada à base B 6 é 
X = (* 1 , x 2 , *3, x 4 ) = (80, 0, 0, -350) 

São soluções básicas factíveis (vértices). 

1) o ponto A; 

2) o ponto B; 

3) o ponto C; 

4) o ponto D. 

14.5.7 Tableau Simplex 

Vamos reescrever o problema do fabricante de móveis da seguinte forma. 

Max L - 4.500.x, - 8.000x 2 - 0x 3 - 0x 4 = 0 

s/a 5x, + 20 x 2 + 0x 3 + 0x 4 -400 

10 x, + 15x 2 + 0 x 3 +0x 4 -450 

x u x 2 ,x 3 , x 4 > 0 

O método simplex sempre começa com uma base inicial factível Como 
no problema do fabricante de móveis todas as restrições são do tipo <> temos 
uma base óbvia que é a identidade, referente às colunas das variáveis de folga 
x 3 e x 4 . 

Portanto, B = ^ ^ ; x 0 = [x 3 , x 4 ] = [400,450] 

0 lj 

e X| =x 2 = 0 (se você não entendeu o porquê disso, leia novamente a definição 
de solução básica factível). E o tableau simplex associado a esta base inicial é 


Colunas j 

2 

3 

x 2 

4 

*3 

5 

x 4 

6 

Linhas da função L 
objetivo 

-4.500 

- 8.000 

0 

0 

0 = Valor atual da 
função objetivo 

Variáveis * 3 

5 

20 

1 

0 

400 = Z>, 

básicas 

x 4 

10 

15 

0 

1 

450 = b 2 
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O tableau simpiex acima consiste de: 

1 ) 6 colunas: A primeira contém informação sobre a base atual (você lê na 

ia coluna a função objetivo L e as variáveis jc 3 e x 4 que são a nossa solução 
básica inicial). As colunas 2 ,3,4 e 5 contêm informação a respeito das 
variáveis x x , x 2 , x 3 e x 4 , respectivamente. E a última coluna contém na 
lã linha o valor atual da função objetivo e nas duas últimas, os valores atuais 
das variáveis básicas x 3 e x 4 . 

2) 3 linhas: A primeira refere-se à linha da função objetivo; os valores na linha 
da função objetivo (excetuando-se a última coluna) são chamados pela 
terminologia da programação linear de custo reduzido. As duas últimas linhas 
referem-se às duas restrições do problema. 

Para verificarmos se o tableau expressa uma solução básica factível basta 
verificar se os valores das variáveis básicas são >0.0 tableau simpiex nos diz que 
a nossa base B é composta pelas colunas x 3 e x 4 da matriz A (veja a 1? coluna do 
tableau) e os valores das variáveis básicas são lidos na última coluna. O tableau nos 
diz também se a solução básica factível associada à base B é ótima ou não. 

Para sabermos se a solução básica factível é ótima ou não, basta verificar 
se existe alguma variável não-básica que entrando na base melhore o valor 
da função objetivo. 


14.5.8 Verificando quem Entra na Base 

As duas variáveis não-básicas no tableau simpiex são x x e x 2 . 

A coluna de x x , no tableau simpiex diz que: “Se aumentarmos a variável 
x x em uma unidade nós utilizamos 5 unidades de x 3 e 10 unidades de x 4 
com um acréscimo no valor da função objetivo de CrS 4.500,00 (repare que 
temos 4.500 porque passamos o custo de x x para o lado esquerdo da 
equação)”. 

A coluna de x 2 diz que: kt Ao aumentarmos a variável x 2 em uma unidade 
nós utilizamos 20 unidades de x 3 e 15 unidades de x 4 e teremos um acréscimo 
de Cr$ 8.000,00 no valor da função objetivo”. 

Como o nosso probléma é maximizar, nós não estamos no ótimo pois 
se entrarmos na base com uma das variáveis não-básicas, x x ou x 2 , nós teremos 
um acréscimo no valor da função objetivo. 

Há vários critérios de entrada na base, mas o mais comum deles é fazer 
entrar na base a variável não-básica que tiver o custo reduzido mais negativo, 
pois assim nós teremos um acréscimo maior no valor da função objetivo 
(isto não quer dizer que necessariamente chegaremos ao ótimo mais rápido!). 


Se seguirmos o critério acima, a variável x 2 entra na base pois ela nos dá um 
acréscimo de Cr$ 8.000,00 no valor da função objetivo (se x x entrasse, nós 
teríamos um aumento de apenas Cr$ 4.500.00). 

Para x 2 entrar na base alguém precisa sair (para manter o posto de B). 
Quem sai da base? 

Se uma unidade de x 2 contribui em Cr$ 8.000,00 para o lucro então 
nós devemos aumentar x 2 o máximo possível, ou seja, nós devemos aumentar 
x 2 até que ele não viole as restrições de matéria-prima e mão-de-obra. 

Para a restrição de matéria-prima nós temos: 

400 

—- = 20 = indica que como nós temos um total de 400 unidades 

disponíveis de matéria-prima e cada unidade de x 2 gasta 
20 unidades de x 3 , então 20 unidades de x 2 podem ser 
processadas sem que a variável x 3 tome-se negativa. 


Para a restrição de mão-de-obra temos: 


450 


= 30 ^ indica que podemos processar 30 unidades de x 2 sem que 
1 x 4 tome-se negativa. 


Portanto, nós devemos fabricar 20 unidades de x 2 pois se fabricarmos 
mais de 20 unidades a restrição de matéria-prima será violada. Observe que 
quando a variável x 2 aumenta, a variável x 3 vai diminuindo, e quando x 2 
atinge 20 unidades a variável x 3 assume o valor zero. 

Portanto, a variável x 2 entra na base com valor 20 e x 3 sai da base 
porque zerou. 

Observação: Se houver mais de uma variável básica que assuma valores 
nulos então deve-se escolher apenas uma delas para deixar a base, as demais 
ficam na base com valores iguais a zero (solução degenerada). 


14.5.9 Pivoteamento 

O tableau simpiex deve expressar a nova base que é formada pelas 
colunas de x 2 e x 4 . A primeira modificação a ser feita no tableau é trocar 
x 3 porx 2 na primeira coluna do tableau. Agora, a fim de que o tableau 
expresse a nova base é necessário isolar x 2 na sua coluna, ou seja, 


*2 


*2 

0 

I- 

0 
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Para transformar x 2 na forma acima nós devemos realizar operações 
no tableau de tal maneira que o elemento*pivô (elemento que se encontra 
na intersecção da coluna da variável que entra na base com a linha da variável 
que sai da base) se tome 1 e os demais elementos da coluna sejam 
transformados em zero* Tal procedimento se chama pivoteamento e nada mais 
é do que realizar operações elementares (veja secção 2*3) no tableau (que é 
equivalente ao sistema gerado pelas restrições do problema na forma padrão) 
com o intuito de transformar a coluna x 2 na forma citada acima. 

Portanto, após efetuado o pivoteamento o tableau simplex toma-se: 

Tableau 2: 



*1 

*2 

*3 

*4 


L 

2.500 

0 

400 

0 

160.000 

*2 

1/4 

1 

1/20 

0 

20 

x 4 

25/4 

0 

15/20 

1 

150 


que corresponde à seguinte base 

I-coluna original de x 4 

B = 20 ° ; X B =[* 2 > X 4 ] = (20, 150] 

15 1 J 

I 

coluna original de x 2 

e temos a seguinte solução básica factível 

x ( x i> x i> *3> x a)~(0, 20, 0, 150) 

E o tableau 2 expressa o seguinte problema: 

Max L - 2.500x 1 + 0x 2 + 400* 3 + 0x 4 = 160.000 

s/a 1/4* t + 0* 2 + 1/20* 3 + 0x 4 - 20 

25/4jc 1 + 0*2 - 15/20x 3 + 0* 4 = 50 

que é equivalente ao problema original pois foram efetuadas operações elementares 
no problema original para se chegar ao problema acima. 

A pergunta que nos surge é: Estamos no ótimo? De novo precisamos verificar 
se ao entrarmos com alguma variável não-básica na base haverá um acréscimo 
(melhoria) no valor da função objetivo. 
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As nossas variáveis não-básicas atuais são er 3 (por qué? ), Vamos verificar o 
que cada uma dessas colunas expressa. 

A coluna de *j nos diz que: “Ao aumentarmos a variável Xj em uma unidade, 
sacrificamos 1/4 unidades de x 2 e 25/4 unidades de x 4 e ao fazermos isto temos 
um acréscimo de Cr$ 2.500,00 no valor atual da função objetivo”. 

A coluna de x 3 nos diz: “Ao aumentarmos a variável x 3 em uma unidade 
usamos 1 / 20 unidades de x 2 e ganhamos 15/20 unidades de x 4 , com decréscimo 
de Cr$ 400,00 na função objetivo”. 

Portanto, se a variável Xj entrar na base será um negócio lucrativo. Enquanto 
que se a variável x 3 entrar na base será um mal negócio, pois o valor da função 
objetivo diminuirá. Logo, a variável x x entra na base. 

E quem sai da base? 

Sai a variável que zerar primeiro. Quando x t aumenta, x 2 diminui em 1 / 4 ; 

20 

portanto, nós podemos aumentar x t até o valor de y j^= 80 sem que a variável x 2 

se tome negativa. E nos podemos aumentar Xj ate = -yj' = 24 sem que 

a variável x 4 se tome negativa. Assim, a variável que zera primeiro é a variável x 4 
e portanto ela deixa a base. 

Assim, devemos pivotear sobre o elemento-pivô que fica na intersecção 
da coluna Xj com a linha da variável básica x 4 . 

Após efetuadas as operações de pivoteamento sobre o tableau atual temos 
um novo tableau: 

Tableau 3: 



Estamos no ótimo? Para responder essa pergunta precisamos verificar 0 que 
as colunas das variáveis não-básicas nos dizem. 
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A coluna de *3 nos diz que: “Ao aumentarmos x 3 em uma unidade 
nós gastamos 4/25 unidades da variável x 2 e ganhamos 3/25 unidades de 
jci , e esta ação nos leva a um decréscimo de Cr$ 100,00 no valor da 
função objetivo*’. Como o problema é de maximização, seria um mal negócio 
fazer a variável x 3 entrar na base. 

A coluna de x 4 nos diz: “Ao aumentarmos * 4 em uma unidade, nós 
ganhamos 1 /25 unidades de x 2 e gastamos 4/25 unidades de x x , ocasionando 
um decréscimo de Cr$ 400,00 no valor da função objetivo”. Esta ação também 
não é lucrativa. 

Como as variáveis não-básicas atuais, r 3 a 4 , do problema não podem 
entrar na base, pois se isso ocorresse nós teríamos um decréscimo no valor da 
função objetivo, nós estamos no ótimo. 

A base ótima é: 

B^[a 2 f a l } = 

e a solução básica factível ótima correspondente a esta base é: 

x* = [*!*, x 2 *, x 3 *, x 4 *] = [24, 14,0,0]^ solução única e finita 
O valor ótimo 

L* = 4.500*! * + 8.000x 2 * = Cr$ 220.000,00 

Agora, olhando no gráfico da região factível apresentado em 14.5.4 
verificamos o caminho feito pelo método simplex até alcançar 0 ponto ótimo X* 


20 5 

[15 10 


Tableau 

Solução 

Pontos correspondentes no gráfico 

1 (inicial) 

2 

3 

X =(0, 0,400,450) 

x =( 0 , 20 , 0 , 150) 

x* = (24, 14,0,0) 

A 

B 

C 


A tabela acima serve simplesmente para verificarmos que o método simplex 
caminha de vértice (= solução básica factível) em vértice até alcançar 0 
ponto ótimo. 

14.5.10 Método Simplex — Uma Visão Algébrica 

Considere o problema de programação linear, dado baixo, na forma padrão 



onde 


Min 

s/a 


2 - cx 

Ax = b 

x > 0 


(D 


A S R m x ( n + jn ) 
x E R 1 x (n + ot) 

b€ R 1 xm 
C £ r(« + m) x 1 

O que nós vamos fazer agora é particionar a matriz A em duas submatrizes, 

B e N, que chamaremos de submatriz básica e submatriz não-básica, respectivamente. 
Da mesma forma, faremos isto com os vetores 
x = [x B> x N ] e c = [c B ,c N ], 

Uma vez feito isto, nós podemos reescrever o problema expresso em 0 da 
seguinte maneira: 


Min z CgXg + 1 

s/a B x B + Nx n = b ( (n) 

x B > 0, x N > 0 J 

Se expressarmos Bx fi + Nx n - b na forma x g = B _1 b - B _ 1 Nx n 
e substituirmos este resultado na linha da função objetivo obtemos: 

Min 2 + O*» + ( c b B ~ ,N_ c n) x n =c b B * b 
s/a x b +B - 1 Nx n -B'*b 

x fi > 0 , >0 

O problema acima é expresso na forma de tableau da seguinte maneira; 



x„ 

x_ 



B 

N 


z 

0 

c b b ‘ n - c n 

c B B " b 

X B 

I 

B-‘N 

B _1 b 


Este tableau nos dá a representação da linha da função objetivo z e das 
variáveis básicas em termos das variáveis não-básicas. Quando temos uma solução 
básica factível, ou seja, uma solução do tipo x = (x b ,x n ) = (x b , 0 ). nós 
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obtemos o valor atual de z (pode ser lido diretamente do tableau na intersecção 
da linha z com a coluna mais à direita do tableau) e os valores atuais das 
variáveis básicas (na coluna mais à direita, logo abaixo da linha de z). 

Sempre que temos uma solução básica factível nós desejamos saber se 
esta solução é ótima ou não. Para sabermos se estamos no ótimo basta verificarmos 
qual é o efeito produzido no valor da função objetivo quando fazemos uma 
variável não-básica, digamos x y, sair do nível zero e passar para um nível positivo; se 
ao fazermos isto ocorrer uma melhoria no valor da função objetivo, então é 
interessante x. entrar na base. Para compreendermos melhor, vamos expressar 
a equação z = c b B _1 b -(c b B _ 1 N - c N )* N de outra maneira: 

z=z 0 — (z. — c.)x. para todo x. pertencente à submatriz N. 
onde: z 0 = B “ 1 b = valor atual da função objetivo 

Z i =C B B 'S 

(zj - cj) = custo reduzido da variável x.. 

Como o problema é minimizar, então é interessante que Xy entre na base 
quando o seu custo reduzido ( z. - c.) for maior do que zero, porque assim 
quando Xy cresce o valor da função objetivo decresce. Se 
( Zj - Cj) < 0 , então o valor da função objetivo aumentará, ou permanecerá 
o mesmo, quando Xy aumentar. Portanto, para um problema de minimização 
as nossas candidatas a entrar na base serão as variáveis não-básicas cujo custo 
reduzido (zy - cj) for maior do que zero. Quando uma ou mais variáveis 
não-básicas satisfizerem (z y « - cy) > 0 usa-se como critério de desempate escolher 
aquela variável não-básica que tiver o custo reduzido mais positivo. 

Suponha que a variável não-básica x k entre na base ((z ^ — cj) > O)* Portanto, a 
variável não-básica x^ sairá do seu nível zero e passará a ter um valor positivo, mudança 
que acarretará um efeito nas variáveis básicas dado pela equação: 

H =h ~y k x k 

onde b = B -1 b = valor atual das variáveis básicas 
y ; = B" 1 = coluna da variável Xj atualizada 

que pode ser reescrita da seguinte maneira: 
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ou ainda, 

% = 6 t - y^k 

Quando a variável x k cresce podem ocorrer 3 casos: 

1) Se y^ k > 0, então a variável x B diminui à medida que x k cresce, ou seja, 

x B . é candidata a sair da base. 

2) Se y ik =0, então x B não se altera quando x± cresce 

3) Se y ik < 0 , então x R cresce à medida que x k cresce. 

Nós só devemos nos preocupar com o caso \>y ik > 0, pois quando x k 
cresce, x B diminui e nós devemos tomar o cuidado de não deixar que x* se tome 

negativo. Cada variável básica que tem seu componente em y k maior do que 
zero é uma candidata a deixar a base, e deixa a base aquela que zerar primeiro. 


14.5.11 Tipos de Solução 

Nós podemos verificar através do tableau simplex soluções do tipo: 

a) Alternativa 

Se no tableau simplex tivermos o ótimo e existir uma variável não-básica„ 
digamos x k , com seu custo reduzido (z k - c k ) igual a zero, então nós temos 
soluções alternativas. Isso é fácil de ver pois 

Z = z 0 -(z k -c k )x k e (z k - c k ) = 0 , 


então x k pode entrar na base que o valor da função objetivo z não se altera, 
ou seja, mudamos de uma solução básica factível (vértice) para outra sem alterar 
a função objetivo; isto ocorre quando temos soluções alternativas. 

b) Ilimitada (z -> a) 

Se no tableau existir alguma variável não-básica candidata a entrar na base, 
digamos x k ,ey k tem todos os seus componentes menores ou iguais a zero 
(casos 2 e 3 da seção anterior), então nós temos solução ótima infinita, pois x k 
pode crescer que nenhuma variável básica sairá da base porque crescerá junto 
com x ky mas se as variáveis básicas crescerem sem limite, z que é função dessas 
variáveis crescerá sem limite também. 


Observação: Compare estas observações com 14.3.3. 
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14.5.12 Resumo do Método Simplex 

Passos do Algoritmo Simplex - Problema de Minimização 

Passo 1: Ache uma solução básica factível com base B. Forme o tableau simplex 
inicial. 



X B 

X N 


z 

0 

c b b ' 1n - c n 

c B B_, b 

X B 

i 

B -l N 

B -1 b 


Passo 2: Calcule (z k - c k ) “ máximo | (z ; - cj) para todas as variáveis 
não-básicas Xj | 

Passo 3 (critério de otimalidade): Se ( z k - c k ) < 0 então pare: a solução 
atual é ótima. Caso contrário, vá para o passo 4. 

Passo 4: Se y k < 0, então pare: a solução ótima é ilimitada. Caso contrário, vá 
para o passo 5. 

Passo 5 (teste da razão): Determine o índice r como se segue 

para apenas os y- k > 0 

Obsen>ação:b r - r-ésimo componente do vetor b = R _1 b 

Passo 6: Pivote em y rk 

Pivoteamento em y rk é definido como. 

a) Divida a linha r por y rk . 

b) Para / = 1,2,atualize a z-ésima linha da seguinte maneira: 
'multiplique a nova linhar por -y ik e some a linha resultante 

à linha i". 

c) Atualize a linha da função objetivo da seguinte maneira: 

“multiplique a nova linha r por ( c k z k )e some a linha resultante 
com a linha da função objetivo’' 

Passo 7. Atualize as variáveis básicas e não-básicas onde x k entra na base e 
x B deixa a base e volte para o passo 2. 

Observação 1: Se o problema for maximizar, apenas o passo 3 (critério de 
otimalidade) sofrerá (por quê?) 


r „ 


y rk 


mínimo 
1 < / < m 


Íí_ 

y* 




Passo 3 (critério de otimalidade): Se ( z k - c^) > 0 então pare: a solução atual 
é ótima. Caso contrário, vá para o passo 4. 

Observação 2: O método simplex trabalha apenas com variáveis não-negativas, 
ou seja, x > 0. Na prática, isso nem sempre acontece; nestes casos precisamos 
fazer uma transformação de variáveis para garantir que todas as variáveis sejam 
não-negativas (veja bibliografia para maiores detalhes). 


14.5.13 Método das 2 Fases 

Como foi dito na seção anterior o método simplex sempre começa com 
uma solução básica factível inicial. 

Quando nós temos um problema linear com todas as restrições do tipo 
< nós temos uma base factível inicial óbvia, que é a identidade formada pelas 
colunas das variáveis de folga. 

Mas nem sempre isso é possível; neste caso, precisamos de um método que 
nos dê uma solução básica factível inicial. Um desses métodos é o método das 2 fases. 

O método das 2 fases começa com a fase 1, que é a minimização da soma 
das variáveis artificiais, sujeita a restrições Ax + x^ "b,x>0e 
x > 0. Se o problema original Ax = b, x > 0, tem solução factível, então o valor 
ótimo para a função objetivo da fase 1 é zero, pois todas as variaveis artificiais 
acopladas ao problema original tendem a zero, ou seja, elas deixam a a base; após 
eliminarmos as colunas pertencentes às variáveis artificiais não-básicas, começamos 
a fase 2 que é resolver o problema original com a base factível encontrada na fase 1 


14.5.14 Resumo do Método das 2 Fases 

Fase 1 : Para cada restrição do tipo > ou = associe uma variável artificial. 
Resolva o problema abaixo começando com a solução básica factível 
x = 0 e x a = b. 

Min z„ ~ lx 

a a 

s/a Ax + X = b 
o 

x > 0, x a > 0 


Se no ótimo o valor de z Q ± 0, então pare: o seu problema original não tem 
solução factível. Caso contrário, elimine todas as colunas artificiais e a linha 
da função objetivo artificial. Vá para a fase 2. 
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Fase 2: Acople a função objetivo linear original e resolva o problema com 
a solução básica factível x R ~B -1 be x N = 0. Observe que x fi contém as 
variáveis legítimas do problema original uma vez que assumimos que as variáveis 
artificiais deixaram a base. Portanto, nós devemos resolver o seguinte problema: 

mn C B X B +C N X N 
s/a x R + B' , Nx N =B" 1 b 
x R 3 ^ 0, x N 3 ^ 0 


14.5.15 Programa-Exemplo 

Nesta seção apresentamos um programa escrito em linguagem Basic que 
resolve problemas de programação linear do tipo 

Max z = cx 
s/a Ax < b 

x>0 

O programa foi escrito com o objetivo de permitir seu uso em qualquer 
microcomputador existente no mercado. Nos micros do tipo Sinclair (TK82-C, 
TK85, CP20CL.) deve-se fazer certas alterações: 

0 Usar o comando de atribuição LET em todas as atribuições do programa. 

ií) Desprezar a entrada dos dados através do comando DATA e utilizar apenas 
a entrada através do teclado (veja o exemplo da rodada). 

a) Listagem do Programa 
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150 


* 

Arrsas 

utilizados 1 

* 

160 


* 

— 


* 

170 


* 



* 

180 


* 

I í < m ) 

I Vetor oue con- 

* 

190 


* 


tem os índices 

* 

200 


* 


das variaveis 

* 

210 


* 


b a s i c s s 

* 

220 


* 

A ( » » n + m +1 ) í tí a t r i z t e c - 

* 

230 


* 


nolOSÍCB 3fTl - 

* 

240 


* 


p 1iada (inclui 

* 

250 


* 


vetor b ) 

* 

260 


* 

F< n+ m > 

t Vetor c' j s t o 

* 

270 


* 

ClC n+m ) 

J Vetor de cus - 

* 

28 0 


* 


tos reduzidos 

* 

290 


* 



* 

300 


* — 

— 


-* 

310 


* 



* 

320 


* 

Observacao X Se a entrada 

* 

330 


* 

de dados 

for através do 

* 

340 


* 

comando 

DATA f deve - se 

+ 

350 


* 

colocar 

a partir da linha 

* 

360 


* 

1350 os 

dados da sesuinte 

* 

370 


* 

forma t 


* 

380 


* 



* 
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* 


Restrição 1 

* 

400 


* 


Restrição 2 

* 

4 J 0 


* 


»*••»»•««•# 

* 

420 


* 


Restrição iti 

* 

430 


* 


h( i > 

* 

4 4 0 


* 


b < 2 > 

* 

450 


* 


. 

* 

460 


* 


b < m '> 

* 

470 


* 


c< 1 > 

* 

480 


* 


c< 2 > 

* 

490 


* 


.*♦♦♦♦ 

* 

500 


* 


c ( n ) 

* 

510 


* 



* 

520 


******************************* 

530 

P r i n t 

• Numero 

de restrições * 


540 

I riput 

N 



550 

P r i n t 

1 Numero 

de variaveis 1 


560 

I n p u t 

N 



570 

NL 

-■ 

N + 1 



580 

N2 

- 

N + ri 
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590 N3 = N + H + 1 

600 Re nu Chamada da rotina de Leitura +** 

MO Gosub 650 

620 Rem #*# Chamada da rotina S i m p 1 e x 

630 Gosub 1200 

640 End 

650 Rem Rotina de Leitura 

660 Rem Declarscao dos arrays *** 

670 Rem *** Dim I1(M)» A < M r N3)* F < N2)> C ií N2) *** 

680 Rem #** □ comentário acima indica as * * * 

690 Rem **# dimensões mínimas dos arrays *** 

700 Dim II < 1.0) ,A<10 f 31 ) p F< 30 > r Cl (30 > 

710 I * 0 

720 For J = NI to N2 

730 I * I + J. 

740 XU I > = J 

750 Next J 

760 For I = 1 to h 

770 For J = NI to N2 

780 If J - M + l Then A(ItJ) = 1 Else AdrJ/ = 0 

790 Next J 

800 Next I 

BiO For I = NI to N2 

820 F < I ) - 0 

830 Next I 

8 40 Print * Entrada da matriz de restrições pelo ■ 

850 Print ■ teclado< T ) ou pelo DATA< D > w 

360 Input R$ 

870 If R$ = 1 T• Theri 1000 

330 For I = 1 to M 

890 For J = 1 to N 

900 Read A( I> J ) 

910 Next J 

920 Next I 

930 For I - 1 to M 

940 Read A( I»N3 ) 

950 Next I 

960 For I ~ 1 to N 

970 Read F< I ) 

9B0 Next I 

990 Returr. 

.1.000 Print ’ Entrada da matriz de restrições 1 

1010 For I = 1 to M 

1020 For J * 1 to N 

1030 Print ' A(■íII•,-íJ } " ) = • í 

1040 Input A< IfJ ) 
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1050 Next J 

1060 Next I 

1070 Print ■ Entrada do Yetor b * 

1080 For I * 1 to M 

1090 Print • b<■ fJf •> = ■; 

1100 Input A( Ir N3 ) 

1110 Next I 

1120 Print ' Entrada do Vetor Custo * 

1130 Print * ( nao inclua folsas ) • 

1140 For I = 1 to N 

1150 Print *c( 1 í I í 1 ) = * r 
1160 Input F( I ) 

1170 Next I 

1180 Return 

1190 Rem **# Rotina Simplex * * * 

1200 2-0 

1210 Kl = 0 

1220 Kl = Kl + 1 

1230 SI » < - Inf ) 

1240 Por L - 1 to N2 

.1.250 For I * 1 to M 

1260 If L = II( I ) Then 1370 

1270 Next I 

1230 S = 0 

1290 For I M to H 

1300 J = II( I ) 

1310 S = S + F( J ) * A( IfL > 

1320 Next I 

1330 Cl. < L ) - F< L ) - S 
1340 If Cl( L ) <* SI Then 1370 
1350 SI = Clt L ) 

1360 K * L 

1370 Next L 

1380 For L = 1 to M 

1390 12 = II( L ) 

1400 Cl( 12 ) - 0 

1410 Next L 

1420 P = EPS 

1430 If SI <= P Then 1700 

1440 K'2 = 0 

1450 0 = Inf 

1460 For L = í to H 

1470 T - A( LfK ) 

1480 If T O 0 Then 1530 
L 4 90 Q = A( L f N 3 )/T 

1500 If 0 >= 0 Then 1530 
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1310 K2 - L 

1520 V - G 

J.530 Next L. 

1540 If K2 = 0 Then 1730 
1550 11 ( K2 ) = K 

1560 T - 1• 0/A ( K2 f K ) 

1570 For L * 1 to N3 

1580 A( K2 r L ) = A( K2»L ) * T 

1590 Next L 

1600 For L = 1 to M 

1610 If L = K2 Then 1660 

1620 D ~ - A< L,K > » 

1630 For J = 1 to N3 

1640 A < LfJ ) * Aí L r J ) + A < K2»J ) * D 

1650 Next J 

1660 Neíít L 

1670 Z=Z+V*51 

1680 Gosub 1750 

1.690 Goto 1220 

1700 Print 1 Solucao otima * 

1710 Gosub 1780 

1720 Return 

1730 Print * Solucao Ilimitada ■ 

1740 Return 

1750 Rem *** Rotina de Impressão *#* 

1760 Print 

1770 Print * Iteracao n« 'i Kl 

1780 Print 

1790 Print * Valores das variaveis basicas * 

1800 Print 

1810 For L = 1 to M 

1820 Print * X("fIlCL)í B ) = 'lAÍ L,N3 > 

1830 Next L 

1840 Print 

1B50 Print * Valor da funcao objetivo * a rZ 

1860 Return 


Existem duas funções pré~definidas: 

0 Eps (linha 1390): menor número representado pela máquina e 
ii) Inf (linha 1200): maior número representado pela máquina 

que foram utilizadas no programa.Caso o seu micro não contenha essas funções, 
atribua valores a Eps e Inf (talvez o manual do micro contenha informações a 
esse respeito). 
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b) Exemplo de uma Rodada 

Vamos utilizar o problema do fabricante de móveis proposto em 14.5.2 
para ilustrar uma rodada do programa. 


Nimero do restrições 

Humvo rfe variaveis 
? •? 

Entrada da «atriz de restrições peio 
teclado! I ) ou pelo Dfilfií D ) 

? 'í 

Entrada d3 «atriz de restrições 
M 1 . 1 ) = ? 5 

fi< 1 , 2 ) = ? 20 

R< 2 f 1 > = ? 10 

R( 2 , 2 ) - ? 15 

Entrada do Vetor b 
b( 1 ) " ? 400 
b( 2 ) - ? 450 
Entrada do Vetor Custo 
( n3o inclua folgas ) 
c( 1 ) = ? 4500 
d 2 ) = ? 8000 

Iteracao n. 1 

Valores das variaveis basicas 

Xt 2 ) = 20 

Xí 4 ) = 150 

Valor úa funcao objetivo ■ 160000 
Iteracao n. 2 

Valores das variaveis basicas 

X( 2 ) = 14 

Xí 1 ) = 24 
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valor Jd funcao oujeti vo ' 220000 
otiri 

rjivi l j 5 ü3í Vâí iáVtlS DtíSiCas 

X( 2 3 = M 
£{ ] ) = 24 

'Jàior da fiiftcao objetivo : 220000 

Caso o leitor deseje rodar o programa utilizando o comando DA TA , deve-se 
acoplar as linhas abaixo ao programa: 

ib’I>0 Data 5,20 i Restncao n. 1 

íííáu Data 10.15 í Restrição ti. 2 

!b70 Data 400,450 \ Vetor 5 

iDÔO Data 4500,11000 ! Vetor Custo 

14.6 EXERCÍCIOS 

1. A Cia. VT produz televisores em cores e em preto e branco. Uma pesquisa de 
mercado indicou que mensalmente podem ser vendidos, no máximo, 4.000 
unidades de aparelhos em cores e 1.000 unidades em preto e branco.’ O setor 
de produção informou que o número de homens-horas disponíveis por mês é 
de 50.000, e um aparelho colorido requer 20 homens-horas e um aparelho 
preto e branco requer 15 homens-horas. 

O Departamento de Vendas informou que para atender os pedidos já 
efetuados este mês, deverãp ser produzidos, no mínimo, 800 aparelhos 
coloridos. Os aparelhos são embalados em caixas de papelão e o departamento 
de matéria-prima informou que, por uma falha de previsão, existem disponíveis 
somente 4.200 caixas para a embalagem dos aparelhos e para este mês não 
está prevista nova compra deste material. Os lucros unitários dos aparelhos são 
r$ 50.000,00 (colorido) e Cr$ 28.000,00 (preto e branco). Deseja-se 
estabelecer o plano de produção que produzirá o lucro máximo para 
esta indústria. 

Arley Tão cria porcos para vender, e ele deseja determinar as quantidades de 
cada alimento que deverão ser dadas a cada porco para obter os requerimentos 
nutricionais a um custo mínimo. O número de unidades de cada tipo de 
ingrediente nutriciona! básico encontrado num quilo de cada alimento é dado 
a tanela abaixo, juntamente com os requerimentos diários e o custo. 
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Ingrediente 

nutricioml 

Quilo de 
milho 

Quilo de 
cereais 

Quilo de 
alfafa 

Mínimo requerido 
diariamente 

Carboidratos 

90 

20 

40 

200 

Proteínas 

30 

80 

60 

180 

Vitaminas 

10 

20 

60 

150 


Custo CrS 2.540,00 2.360,00 2.000,00 


3. A Cia. Sovina de Investimentos possui Cr$ 6.000.000,00, quantia esta que 
deverá ser aplicada em 5 tipos de investimento, sendo que os retornos para cada 
investimento são: investimento 1 (11): 10%, investimento 2 (12): 8%; 
investimento 3 (13): 6%; investimento 4 (14): 5%; investimento 5 (15): 9%. 

O gerente desta Cia. deseja diversificar os investimentos para obter o 
máximo rendimento possível. Dado o elemento de risco envolvido, o gerente 
restringiu a quantia aplicada no II a não mais que a quantia total que irá 
investir em 13,14 e 15 (em conjunto). A quantia total aplicada em 12 e 15 deve 
ser pelo menos igual à quantia aplicada em 13. O 12 deve estar limitado a um 
nível que não exceda a quantia aplicada em 14. 

E preciso determinar a alocação ótima de investimento entre as 
5 categorias, de forma que o retomo ao final do ano seja o máximo possível. 

4. Um fazendeiro quer comprar as seguintes quantidades de fertilizantes: 
fertilizante 1: 185 ton; fertilizante 2: 50 ton; fertilizante 3: 50 ton; 
fertilizante 4: 200 ton. Ele pode comprar estes fertilizantes em 3 lojas 
diferentes sendo a disponibilidade de cada loja e os custos dos vários tipos 
de fertilizantes nas várias lojas fornecidos nas tabelas abaixo. 


Disponibilidade 


Fertilizante 

lAJJd 

1 

2 3 

4 

1 

70 

60 

150 

2 

100 

30 

100 

3 

100 

40 35 

70 
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Custo Cr$/ton 


Fertilizante 

Loja 

i 

2 

3 

4 

1 

450 

- 

300 

319 

2 

42S 

180 


350 

3 

480 

200 

240 

325 


Como o fazendeiro pode preencher suas necessidades de fertilizante 
a um custo mínimo? 

5. A Cia. ZigZag possui fábricas em Campinas e Belo Horizonte. Esta Cia. produz 
e distribui máquinas de costura a comerciantes de várias cidades. Numa 
determinada semana, a Cia. possui: 30 unidades em Campinas e 40 unidades 
em BH. Nesta mesma semana, esta Cia. deve atender os pedidos dos comerciantes 
das seguintes cidades: São Paulo: 20 unidades. Rio de Janeiro: 25 unidades e 
Vitória: 25 unidades. 

O problema consiste em distribuir as máquinas aos comerciantes de forma 
a atender os pedidos a um custo mínimo de transporte. Os custos unitários são: 


Destino 

Origem 

SP 

RJ 

Vitóriã 

Campinas 

700 

1.300 

2.000 

BH 

2.200 

1.800 

1.700 


6. Uma refinaria mistura 4 tipos de gasolina e produz 3 tipos de combustível. 
Os dados são fornecidos nas tabelas abaixo. 
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Combustível 

Taxa mínima 
de octano 

Lucro 

Demanda diária 

i 

95% 

7.200 u.c.p. 

no máximo 10.000 

2 

90% 

6.000 u.c.p. 

— 

3 

85% 

5.000 u.c.p. 

pelo menos 15.000 


A refinaria vende a gasolina não usada para produzir combustível a 4.900 u.c.p. 
se sua taxa de octano for acima de 90% e a 3.800 u.c.p. se sua taxa de octano 
for menor que 90%. Como pode a refinaria maximizar o lucro total diário? 

7. a) Resolva o problema dos televisores (Exercício 1) pelo método gráfico. 

b ) Escreva o problema na foima padrão. 

c) Através da solução obtida no item a), calcule o valor das variáveis de folga 
na solução ótima; 

d) Interprete os valores das variáveis de folga. 

8. Um aluno do curso de MS415 quer aproveitar o que já aprendeu a respeito da 
Programação Linear para resolver um problema particular muito grave. 
Atualmente, ele possui duas namoradas: Maria e Luísa. Ele faz alguns cálculos 
e estudos, dos quais concluiu que: 

a) Maria, muito elegante e sofisticada, prefere freqüentar bares e boites mais 
requintados, de modo que uma saída de 3 horas custará Cr$ 1.500,00. 

b) Luísa é mais simples e prefere divertimentos mais populares, de modo que 
uma saída de 3 horas custará Cr$ 800,00. 

c) Após pagar as contas da república onde mora, e outros gastos, restam para 
ele CrS 5.000,00 mensais para diversão. 

d) Seus afazeres escolares são muitos (lista de exercícios, programas etc.) e 
consomem muito do seu tempo e energia, de tal forma que lhe sobram, 
mensalmente, 30 horas e 40.000 calorias para as atividades sociais. 

é) Cada saída com Maria consome 3.000 calorias, mas com Luísa, mais alegre 
e extrovertida, gasta o dobro. 

f) É importante colocar que ele gosta das duas com a mesma intensidade. 

Tomando como base as conclusões acima, ele quer planejar sua vida social 
de modo a obter o número máximo de saídas. 

Formule o problema e resolva-o. Após conseguir o resultado, comunique-o 
à classe para que este aluno (que prefere que seu nome não seja revelado por 
razões que parecem óbvias) possa conferir com a solução ótima por ele obtida. 
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9. A Cia. KI-SORVETEBOM produz dois tipos de sorvetes: picolé e copinho. 

Nesta Cia. o único ponto crítico é a mão-de-obra disponível. O copinho 
consome 50% a mais de mão-de-obra que o picolé. Sabe-se também que se todo 
o sorvete produzido fosse do tipo picolé a Cia. produziria 400 toneladas por dia. 
O mercado limita a produção diária do copinho e picolé em 150 e 300 toneladas, 
respectivamente. 

0 lucro por tonelada de copinho e picolé produzidos é Cr$ 5.000,00 
e Cr$ 3.500,00 por tonelada, respectivamente. 

Formular e resolver o problema que permita determinar a quantidade 
a ser produzida de cada tipo de sorvete. 

Discuta a solução ótima obtida e verifique os valores das variáveis de folga. 

10. -Resolva todos os exercícios que você achar interessante (incluindo aqueles 
propostos na solução geométrica e os desta seção) que podem ser resolvidos 
pelo método simplex sem usar o método das 2 fases. 

11. Resolva o Exercício 2 desta seção usando o método das 2 fases. Repare que 
como as restrições são do tipo > então é necessário subtrair variáveis (neste caso 
chamadas de variáveis de excesso) para colocar o problema na forma padrão. 


147 RESPOSTAS 

147.1 Respostas de 14.4 



x - 2y - l <0 
g \x+y+2>0 
2* - y - 2 < 0 
4* - Sy + 8 > 0 

10. 80 do tipo A e nenhum de B. 

12. O primeiro método 100 minutos e o segundo 25 minutos. 

14. T - 200°C e P = 20 atmosferas 

147.2 Respostas de 14.6 

1. Sugestão: faça x x = quantidade de televisores coloridos produzidos 

x 2 = quantidade de televisores branco e preto produzidos 

3. Seja X- = quantidade aplicada no investimento 

Max 2 = 0,1*! + 0,08*2 + 0,06* 3 + 0,05*4 + 0,09* s 

s/a *i + x 2 + x 3 + jc 4 + * 5 = 6.000.000 

*i < x 3 + x 4 + *s 

x 2 + * s >3 ; x 2 <* 4 e x. >0 

4. x f j = quantidade (em toneladas) de fertilizante i comprado na loja / 

Min z = 450x n + 425* 12 + 480* 13 + 180*22 + 200* 2 3 + 

-1-300*3! +240*33 + 319*41 + 350* 4 2 + 325* 43 

s/a *! | + * 12 + *13 = 185 

*22 + *23 = 50 

*31 + *33 = 50 

*41 + *42 + *43 = 200 


* 

/A 

-4 

O 

* 31 < Ó0 

X n <100 

*33 ^ 35 

*,3 < 100 

*4i ^ 150 

%2\ < 30 

*42 ^ 100 

O 

Tf 

V/ 

r * 

/A 

o 


6. Não 




5. Sugestão: x^ = número de máquinas de costura transportadas da cidade i 
para a cidade / (/ = 1 , 2 ; j - 1 . 2 , 3 ) 
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A 

Adição de matrizes, 6 
Adjunta, matriz, 72 
Aleatória, variável, 236 
Amostrai, espaço, 236 
Ângulo entre dois vetores, 219 
Aplicação 

identidade, 178 
injetora, 151-152 
nula, 195 
sob reje tora, 152 

Auto-adjunto, operador, 253, 258 
diagonalização, 261-262 
Autovalor, 16,180, 335 
de uma matriz, 184 
multiplicidade algébrica de, 194 
multiplicidade geométrica de, 194 
subespaço associado, 183 
Autovalores de operadores 

auto-adjuntos, 262 
Autovetor, 16,180 
de uma matriz, 184 


B 

Base, 116,118, 203 
de um subespaço, 131 
matriz mudança de, 125,126 
mudança de, 15 
por rotação, 17 
ortonormal, 229 
Bilinear 

forma, 270 

matriz de uma forma, 272 


C 

Cadeia de Markov, 14 
Característico 
polinómio, 1 84 
valor, 180 
vetor fixo, 180 
Cartesianas, equações, 286 
Glindro, 300 
elíptico, 300 
hiperbólico, 301 
parabólico, 301 
Circunferência, 289 
Gsalhamento, 150 
Classificação 

das cônicas, procedimento geral, 
296,297-298 
das quadráticas, 299-304 
Coeficientes 

de Fourier, 225-226 
matriz de, 65 
Cofator, 70 
Co fatores, 
matriz de, 72 
Coluna, matriz, 3 
Complemento 
algébrico, 70 
ortogonal, 234 
Cone quadrático, 300 
Conjuntos convexos, 350-374 
Cônicas 

classificação, 296,297-298 
forma reduzida das, 291 
no plano, 289 
Contração uniforme, 147 
Correlação linear, coeficiente de, 238 
Gamer, Regra de, 77 
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D 

Degenerada, hipérbole, 290 
Degenerada, parábola, 290, 291 
Degeneradas, quád ricas, 301 
Dependência e independência Linear, 
114 

Desenvolvimento de Laplace,69 
Desigualdade de Schwaiz, 228 
Desigualdade trangular, 228 
Desvio padrão, 237 
Determinante, 66 
Diagonal, matriz, 4 

Diagonalização de formas quadráticas, 
277,278 

Diagonalização de operadores, 199 
Diagonalização de operadores auto- 
adjuntos, 261,262 
Diagonalização simultânea de opera¬ 
dores, 209 

Diagonalizável, matriz, 213 
Dimensão de um espaço vetorial, 119 
Dual, espaço, 282 

E 

Elementar, matriz, 82 
Elipse, 289 

Elipse degenerada, 291 
Elipsóide, 298 
Elíptico, cilindro, 300 
Elíptico, parabolóide, 299 
Equação diferencial, 317 
Equação diferencial linear homogênea, 
319 

Equações cartesianas, 286 
Equações diferenciais, sistemas linea¬ 
res, 316 

Erro, estimativa de, 346 
Escalar 

multiplicação por, 7 
produto, 220,221 
Escalonada, matriz, 190 
Espaço amostrai, 236 
Espaço dual, 282 
Espaço vetorial, 103 
complexo, 103, 105 
dos polinómios, 105 
real, 103 
R",104 


Espaços vetoriais isomorfos, 156 
Esperado, valor; veja valor médio 
Exato, processo, 332 
Expansão uniforme, 147 

F 

Forma bilinear, 270 
matriz de, 272 

Forma bilinear simétrica, 274 
Forma de Jordan, 210 
Forma escada, matriz-linha reduzida à, 
34-38 

Forma linear, 269 
Forma quadrática, 274 
diagonalização, 277, 278 
positiva definida, 282 
Forma reduzida das cônicas, 291 
Função objetivo, 362 

G 

Gauss, método dc, 36,51 
Gauss-Seidel, processo de, 345 
Gram-Schmidt, processo de, 229, 230 
veja processo de ortogonalização 
Grau de liberdade de sistemas de 
equações lineares, 4546 

H 

Hipérbole, 290 
Hipérbole degenerada, 290 
Hiperbólico,cilindro, 301 
Hiperbólico, parabolóide, 300 
Hiperbolóide de duas folhas, 299 
Hiperbolóide de uma folha, 299 
Homogênea,equação diferencial 
linear, 319 


I 

Identidade, matriz, 4 
Imagem, 151-155 

Impossíveis, sistemas de equações li 
ncares, 29 


Indeterminados, sistemas de equações 
lineares, 44 
Injetoia, 196 

aplicação, 151-154 
Intersecção de, 110 
Inversa, matriz, 73 
Inversível, matriz, 335, 337 
Inversão, 66 
Isomorfismo, 156 
Iterativo , processo, 333 


J 

Jacobi, método de, 344 
Jordan, forma de, 210 


L 

Linear 

homogênea, equação diferencial, 
319 

operador, 180 
variedade, 109 
Linha 

matriz, 4 
Linha equivalente 
matriz, 36 

Linha reduzida â forma escada 
matriz, 36-38 

M 

Markov 

cadeia de,14 
processo dc, 14 
Matriz, 1 
adjunta, 72 
coluna, 3 

das probabilidades de transição, 15 

de coeficientes, 65 

de cofatores, 72 

diagonal, 4 

elementar, 82 

escalonada, 190 

identidade, 4 

inversa, 73 

inversível, 184, 185, 335, 337 


linha, 4 

linha equivalente, 36 
linha reduzida à forma escada, 
36,38 

linhas independentes de uma, 40 
norma de, 188, 189, 340 
nula, 3 
nulidade, 38 
ortogonal, 254 
posto de, 39, 45 
produto, 10 
quadrada, 3 
simétrica, 5, 7, 254 
transposta, 7 
triangular, 91 
triangular inferior, 4 
triangular superior, 4 
Matriz de uma transformação com¬ 
posta, 163 

Matriz de uma transformação inversa, 
165 

Matriz de uma transformação linear, 
157 

Matriz diagonalizável, 213 
Matriz, mudança de base, 125, 126 
Matrizes 

adição de, 6 
iguais, 3 

linha equivalentes, 85 
multiplicação de, 9 
semelhantes, 92 
sequência de, 12, 178,333 
série de, 180, 334 
Matnzes semelhantes, 166 
Máximos e mini mos, valores, 109 
Médio, valor, 223, 254 
Método 

da variação dos parâmetros, 3 25 
das duas fases, 391 
de Gauss, 36, 51 
simplex, 374404 
pivoteamento, 383 
solução geométrica, 376 
tableau simplex, 381 
visão algébrica, 386 
Minimal, polinómio, 206, 207 
Mudança de base, 125 
Mudança de base por rotação, 127 
Multiplicação por escalar, 7 
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N 

Norma, 219-221 
de matriz, 340 
do máximo, 341 

Normalizado, vetor, 227; veja vetor 
unitário 

Núcleo, 151-155 

Nula, matriz, 3 

Nulidade, 162 
matriz, 38 

Número de soluções de sistemas de 
equações lineares, 29 


O 

Operações elementares sobre as linhas 
de uma matriz, 35 
Operador 

auto^adjunto, 253, 258 
diagonalizável, 203 
idempotente, 215 
linear, 180 
nilpotente, 214 
ortogonal, 253 

caracterização, 261 -262 
Ortogonal, matriz, 254 
Ortogonal, operador, 253 
Ortogonais, vetores, 224, 225 
Ortogonalização,processo de, 229, 230 
Ortonormal, base, 229 


P 

Parábola, 290 
Parabolóide 
elíptico, 299 
hiperbólico, 300 

Parâmetros, método de variação dos, 
325 

Permutação, 66 

Perpendiculares, vetores, 224-225 

Plano, no espaço, 288 

Plano 

retas no, 288 
vetores no, 97 

Polinómio calculado em matriz, 203 


característico, 185 
minimal, 206-207 

Polinómios, espaço vetorial dos, 105 
Possíveis, sistemas de equações 
lineares, 29 
Posto, 162,187 

de matriz, 39,45, 80 
Probabilidades de transição, matriz 
das, 15 

vetor de, 15 
Processo 

aleatório, 14 
de Markov, 14 
exato, 232 
iterativo, 232 
Produto 

escalar, 220-221 
interno, 220-221 

em espaços vetoriais com¬ 
plexos, 234 
usual, 222 
matriz, 10 

Programação linear, 362 
método 

geométrico, 362 
simplex, 374-404 
programa-exemplo, 392 
teorema fundamental da, 
368,379 


Q 

Quadrada, matriz, 3 
Quádricas 

classificação das, 298-301 
degeneradas, 301 
no espaço, 298 


R 

Reflexão, 148,178,181 
Região 

factível, 362 

poliedral convexa fechada, 358 
Reta no plano, 287 
Rotação, 149,182 


S 

Segmento, 356 
Semi-espaço 
aberto, 354 
fechado, 354 
Simétrica, matriz, 5, 7 
Sistemas de equações lineares, 29 
equivalentes, 32,36 
grau de liberdade de, 45,46 
impossíveis ou incompatíveis, 44 
indeterminados, 44 
número de soluções de, 44 
possíveis (ou incompatíveis), 44 
resolução de, 29 
solução de, 33,41 
Sistemas equivalentes, 85 
Solução 

de um sistema de equações diferen¬ 
ciais, 318, 319 

geral de uma equação diferenciai, 
318 

geral de um sistema de equações 
diferenciais, 318 
Subconjunto convexo, 356 
Subespaços vetoriais, 105 
gerados, 112 
intersecção de, 110 
soma de, 111 
soma direta de, 11 2 
Submatriz, 70, 80 


T 

Tableau simplex, 381 
base inicial factível, 381 
solução 

alternativa, 389 
ilimitada, 389 
Transformação linear, 142 
Transformações 


do plano no plano, 147 
lineares invereíveis, 165 
Translação, 150 
Transposição, 7 
Transposta, matriz, 7 
Triangular inferior,matriz, 4 
Triangular superior, mat riz , 4 


u 

Unitário, vetor, 227 


V 

Valor 

característico, 1 80 
esperado; veja valor médio 
médio, 223, 237 

Valores ma'ximos e mínimos, 109 
Variação dos parâmetros, método, 
325 

Variação linear, 351 
Variança, 237 
Variável aleatória, 236 
Variedade linear, 104, 109, 114 
Vazio, 291 

Vértices, caracterização geométrica 
dos, 360 
Vetor 

característico, 180 
de probabilidades, 15, 236 
fixo, 178 
Vetores, 102 

Ll, 114 

no espaço, 101 
no plano,97 
Vetoriais 

espaços, isomorfos, 1 56 
subespaços, 105 




